爬虫那些事一些脚本说明
来源:互联网 发布:佛山新城网络联系方式 编辑:程序博客网 时间:2024/05/21 12:48
如下有段java启动脚本:
export JAVA_HOME=jdkexport JRE_HOME=$JAVA_HOME/jreexport CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:.:$CLASSPATHJAVA=$JAVA_HOME/bin/javaJAVA_OPTS="$JAVA_OPTS -server -Xms256m -Xmx1024m -Xmn128m"#performance OptionsJAVA_OPTS="$JAVA_OPTS -XX:+AggressiveOpts"JAVA_OPTS="$JAVA_OPTS -XX:+UseBiasedLocking"JAVA_OPTS="$JAVA_OPTS -XX:+UseFastAccessorMethods"JAVA_OPTS="$JAVA_OPTS -XX:+DisableExplicitGC"JAVA_OPTS="$JAVA_OPTS -XX:+UseParNewGC"JAVA_OPTS="$JAVA_OPTS -XX:+UseConcMarkSweepGC"JAVA_OPTS="$JAVA_OPTS -XX:+CMSParallelRemarkEnabled"JAVA_OPTS="$JAVA_OPTS -XX:+UseCMSCompactAtFullCollection"JAVA_OPTS="$JAVA_OPTS -XX:+UseCMSInitiatingOccupancyOnly"JAVA_OPTS="$JAVA_OPTS -XX:CMSInitiatingOccupancyFraction=75"APP_DIR="."CONF_DIR="$APP_DIR/conf"CFG_NAME="$CONF_DIR/global.properties"TIMEZONE="-Dfile.encoding=UTF8 -Duser.timezone=GMT+08"nohup $JAVA $JAVA_OPTS $TIMEZONE -cp "$CONF_DIR:$APP_DIR/lib/GetTask-0.0.1.jar:$APP_DIR/lib/*" cn.put.tasks.GetTask $CFG_NAME > /dev/null 2>&1 &#$JAVA $JAVA_OPTS -cp "$CONF_DIR:$APP_DIR/lib/GetTask-0.0.1.jar:$APP_DIR/lib/*" cn.put.tasks.GetTask $CFG_NAME
前面三条:export 是引入环境变量以及jar包运行路径,JAVA_OPTS指定JVM运行的参数:
1. -client,-server
这两个参数用于设置虚拟机使用何种运行模式,client模式启动比较快,但运行时性能和内存管理效率不如server模式,通常用于客户端应用程序。相反,server模式启动比client慢,但可获得更高的运行性能。
指定虚拟机运行参数Xms表示最小分配堆内存256M ,Xmx1024M表示最大堆内存为1024M,-Xmn128m表示年轻带的heap大小为128m
3.性能参数
AggressiveOpts 加快编译,当新的性能优化集成到HotSpot VM中之后,可以通过-XX:+AggressiveOpts选项来启用。
UseBiasedLocking,表示启用偏向锁,这样就可以改善系统性能,偏向锁是指在同步时,通常同步对象一直是一个线程赞有,这样通过在jvm对象头中存储当前线程,这样同一个线程执行同步代码块时就可以不需要进行耗时的获取和释放锁操作,提高了程序的性能。
UseFastAccessorMethods 原始类型的快速优化
DisableExplicitGC 关闭system.gc()
UseParNewGC :设置年轻代为并行收集,可以与CMS收集同时使用。
UseConcMarkSweepGC:使用CMS内存收集
CMSParallelRemarkEnabled: 降低标记停顿
UseCMSCompactAtFullCollection :在Full GC的时候对老年代进行压缩,CMS是不会移动内存的,因此这个非常容易产生碎片, 导致内存不够用, 因此, 内存的压缩这个时候就会被启用。 增加这个参数是个好习惯。可能会影响性能,但是可以消除碎片影响
UseCMSInitiatingOccupancyOnly:使用手动定义初始化定义开始CMS收集,禁止hostspot自行触发CMS GC
CMSInitiatingOccupancyFraction=75:使用CMS进行垃圾收集,使用超过75%的时候开始CMS收集
4、其它参数
TIMEZONE="-Dfile.encoding=UTF8 -Duser.timezone=GMT+08" 设置文档编码utf-8 ,时区为东八区
-cp 和 -classpath 一样,是指定类运行所依赖其他类的路径,通常是类库,jar包之类,需要全路径到jar包
- 爬虫那些事一些脚本说明
- 爬虫那些事-爬虫设计思路
- 关于网络爬虫的那些事:干掉伪装的爬虫
- Java爬虫那些事---下载分析
- 爬虫那些事儿-- 简介
- 继承那些事。。。。实例说明(1)
- SQL Server 生成脚本的一些参数说明
- SQL Server 生成脚本的一些参数说明
- ThinkPHP V2.2 说明文档没有说明的那些事!!!
- 爬虫那些事儿---爬虫选择策略
- 爬虫/脚本/Python语言- 脚本
- 项目中那些事| ListView 一些问题
- 想写一些SpringMVC那些事
- 那些关于C语言的一些事
- 爬虫中的groovy脚本
- 第一个爬虫脚本
- 一些说明
- 一些说明
- 配置spring-aop
- 如何搜索网易云中的评论
- 十条PHP常用代码
- 精益产品探索
- 主题:SpringMVC深度探险(一) —— SpringMVC前传
- 爬虫那些事一些脚本说明
- 63. Unique Paths II 我的不知为什么ac不了
- 网站性能优化
- 「美团 CodeM 初赛 Round A」倒水
- VPN使用问题
- javascript中的深拷贝和浅拷贝?
- eclipse 导入一个web项目 在servers 的available无法看到该项目
- 求π的值
- JavaScript基础