hadoop 及word转换pdf方法介绍[个人整理资料2014-03-14]
来源:互联网 发布:二宫和也 知乎 编辑:程序博客网 时间:2024/04/30 06:06
sqoop import --connect jdbc:mysql://localhost:3306/yg_main --username root --password root --table item --hive-import --hive-table default.item -m 1
1.从mysql中导数据到hdfs和hive中
./sqoop import --verbose --fields-terminated-by ',' --connect jdbc:mysql://localhost:3306/yg_main --table item --username root --password root --hive-import --warehouse-dir item --fields-terminated-by ',' --hive-table default.item
sqoop import --verbose --fields-terminated-by ',' --connect jdbc:mysql://$dbhost/$db --table "$table" --username xxx --password xxx --hive-import --warehouse-dir xxx --fields-terminated-by ',' --split-by $splitfield --hive-table $hivetable
2.启动 hive thrift
安装好后启动hive thrift
# ./hive --service hiveserver 10000 >/dev/null 2>/dev/null &
3.启动hbase thrift server
# ./bin/hbase-daemon start thrift 默认是9090端口
4.启动hbase
./bin/start-hbase.sh
jsp查看进程,多一个hbase进程
14592 HMaster
hbase reginserver: http://localhost:60030
先启动hbase 再启动hadoop 如先启动hadoop有时 HMaster无法启动(原因不清楚)
格式化文件系统
bin/hadoop namenode -format
注:hbase启动可能会出错导致失败,这时需要将$HADOOP_HOME/hadoop-core-*.*.*.jar和$HADOOP_HOME/lib目录下的commons-configuration-*.*.jar拷贝到$HBASE_HOME/lib目录下,删除$HBASE_HOME/lib目录下的hadoop-core-*.jar,避免版本冲突和不兼容。
编写hadoop的mapreduce程序,需要很多它自带的jar包,在我的电脑中,一部分在/usr/share/hadoop中,另一部分在/usr/share/hadoop/lib中,现在我的/etc/profile文件是这样写的:
export HADOOP_HOME=/home/eboss/hadoop
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk-amd64
export JRE_HOME=$JAVA_HOME/jre
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib:$HADOOP_HOME/bin:$JRE_HOME/lib:$HADOOP_HOME:$CLASSPATH
soffice --headless --accept="socket,host=127.0.0.1,port=2002;urp;" -nofirststartwizard
转pdf文件
首先要安装好openoffice3,然后命令行下启动服务,最简单的方法如下:
soffice -accept="socket,port=2002;urp"
1.用python
https://github.com/mirkonasato/pyodconverter
先启动office
$ soffice "-accept=socket,port=2002;urp;"
python DocumentConverter.py test.odt test.pdf
2.用java
jodconverter 来转换
命令:java -jar /usr/local/jodconverter-core-3.0-beta-4/lib/jodconverter-core-3.0-beta-4.jar /home/a.doc /home/a.pdf
>vi convert.php
<?php
system("/opt/openoffice.org3/program/python DocumentConverter.py test.ppt test.swf");
?>
>/usr/local/php5/bin/php convert.php
1.从mysql中导数据到hdfs和hive中
./sqoop import --verbose --fields-terminated-by ',' --connect jdbc:mysql://localhost:3306/yg_main --table item --username root --password root --hive-import --warehouse-dir item --fields-terminated-by ',' --hive-table default.item
sqoop import --verbose --fields-terminated-by ',' --connect jdbc:mysql://$dbhost/$db --table "$table" --username xxx --password xxx --hive-import --warehouse-dir xxx --fields-terminated-by ',' --split-by $splitfield --hive-table $hivetable
2.启动 hive thrift
安装好后启动hive thrift
# ./hive --service hiveserver 10000 >/dev/null 2>/dev/null &
3.启动hbase thrift server
# ./bin/hbase-daemon start thrift 默认是9090端口
4.启动hbase
./bin/start-hbase.sh
jsp查看进程,多一个hbase进程
14592 HMaster
hbase reginserver: http://localhost:60030
先启动hbase 再启动hadoop 如先启动hadoop有时 HMaster无法启动(原因不清楚)
格式化文件系统
bin/hadoop namenode -format
注:hbase启动可能会出错导致失败,这时需要将$HADOOP_HOME/hadoop-core-*.*.*.jar和$HADOOP_HOME/lib目录下的commons-configuration-*.*.jar拷贝到$HBASE_HOME/lib目录下,删除$HBASE_HOME/lib目录下的hadoop-core-*.jar,避免版本冲突和不兼容。
编写hadoop的mapreduce程序,需要很多它自带的jar包,在我的电脑中,一部分在/usr/share/hadoop中,另一部分在/usr/share/hadoop/lib中,现在我的/etc/profile文件是这样写的:
export HADOOP_HOME=/home/eboss/hadoop
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk-amd64
export JRE_HOME=$JAVA_HOME/jre
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$HADOOP_HOME/lib:$HADOOP_HOME/bin:$JRE_HOME/lib:$HADOOP_HOME:$CLASSPATH
soffice --headless --accept="socket,host=127.0.0.1,port=2002;urp;" -nofirststartwizard
转pdf文件
首先要安装好openoffice3,然后命令行下启动服务,最简单的方法如下:
soffice -accept="socket,port=2002;urp"
1.用python
https://github.com/mirkonasato/pyodconverter
先启动office
$ soffice "-accept=socket,port=2002;urp;"
python DocumentConverter.py test.odt test.pdf
2.用java
jodconverter 来转换
命令:java -jar /usr/local/jodconverter-core-3.0-beta-4/lib/jodconverter-core-3.0-beta-4.jar /home/a.doc /home/a.pdf
>vi convert.php
<?php
system("/opt/openoffice.org3/program/python DocumentConverter.py test.ppt test.swf");
?>
>/usr/local/php5/bin/php convert.php
0 0
- hadoop 及word转换pdf方法介绍[个人整理资料2014-03-14]
- word转换为pdf实用方法介绍
- 【转】PDF转换Word 方法盘点--附个人实践点评
- SharePoint 2013 Word 转换PDF服务介绍及示例
- Word怎么转换成PDF格式的方法介绍
- word如何转换成PDF转换器简单方法介绍
- 将word转换成PDF的方法介绍
- 详细介绍Word转换为PDF的方法步骤
- 图文混合PDF转换成Word方法介绍 PDF转换器下载
- PDF转换成Word在线转换方法
- PDF转换word格式的方法总结
- Word转换成PDF格式文件的方法
- word转换成PDF最快的方法
- word如何转换成PDF的方法
- word转换为pdf方法与技巧
- PDF转换成word通用的方法
- word文件转换成pdf的方法
- word转换成PDF的方法分享
- Linux各目录的内容
- ios画图库
- 【LeetCode】Container With Most Water
- 移动开发者必须了解的10大跨平台工具
- 系统及IDE重装
- hadoop 及word转换pdf方法介绍[个人整理资料2014-03-14]
- 手动12 - 安装php加速器 Zend OPcache
- webview 2.3.x系统时shouldOverrideUrlLoading不起作用
- 乌克兰示威两派民众爆冲突 致一人死亡16人受伤
- 简谈RAID0+1和RAID5的区别和优缺点
- MongoDB整合Spring(Maven项目)
- Android 重写Gallery 左对齐
- mac下如何写shell脚本
- VC++自定义单文档应用程序界面图标以及 *.exe 桌面图标