ODPS之Tunnel上传下载
来源:互联网 发布:用微信能在淘宝网购物 编辑:程序博客网 时间:2024/05/29 11:05
上传目录
Tunnel help upload查看上传命令参数设置
本地目录结构
ODPS项目表结构
尝试整个目录上传
查看上传结果
可以确定的是本地downloadSample文件夹中的文件并没有被追加进表中
多线程上传
清空t_people:truncate table t_people;
设置两个文件对应两个线程上传
设置两个文件对应三个线程上传
设置三个文件对应三个线程上传
上传的线程与需要上传的文件进行了绑定。一个文件对应一个线程,多设置线程也没用。需要上传的文本并不会在本地被读入内存后拆分为3份分配给三个线程,而是直接从硬盘按文件读入后以文件为单位分配给线程进行上传。
容忍错误记录&容忍脏数据量
在man.csv文件中放置一个脏数据,然后尝试执行上传命令
在man.csv文件中放置一个脏数据,然后尝试执行’容忍错误discard bad records‘的上传命令
在man.csv文件中放置两个脏数据,然后尝试执行‘容忍错误‘的上传命令
在man.csv文件中放置两个脏数据,然后尝试执行‘限制错误记录上限max bad record’的上传命令; PS:在设置容忍错误数量时,容忍错误dbr必须设置为true才会生效。
扫描文件
设置上传前本地文件预检查(scan only)——不消耗上传流量(扫到一处错误就停止)
设置上传前本地文件预检查(scan only)——允许容错数:1(跳过一个错误后会继续后续扫描)
设置上传前本地文件预检查(scan only)——允许容错数:2
行、列分隔符
修改man.csv的列分隔符和行分隔符为中文的,和中文的两个||
配置Tunnel上传命令中的行分隔符(row delimiter)和域分隔符(field delimiter)尝试上传数据
NULL值处理
1.逻辑运算中的NULL
NULL and TRUE=NULL NULL and FALSE=FALSE
NULL or TRUE=TRUE NULL or FALSE=NULL
2.文件中的缺省值默认用NULL表示,可以设置为不用NULL标识出缺省值
为什么不是替换缺省标记而是删除缺省标记呢?
指定时区
默认文本内时间为本地时间时的上传
设置文本内时间为东京时间的上传
- ODPS之Tunnel上传下载
- ODPS使用之上传下载数据
- ODPS Tunnel download
- Linux之ssh tunnel
- 基于java和tunnel-sdk的OSS与ODPS之间的数据连通
- 阿里音乐预测 之 初探ODPS SQL
- 使用阿里云ODPS之点滴
- tunnel
- odps新手上路之安装Eclipse开发环境
- MaxCompute(原ODPS)任务优化之列裁剪
- 传智播客学习之上传下载
- 文件上传下载之FileUpload
- web上传下载之--ajaxFileUpload
- shell之ftp上传下载
- ODPS Graph
- ODPS简介
- ODPS UploadSample
- ODPS DownloadSample
- C# 6 与 .NET Core 1.0 高级编程
- 并查集水题
- 负载均衡之HTTP重定向
- cpp——类——作用域 名字查找
- HashMap底层实现原理/HashMap与HashTable区别/HashMap与HashSet区别
- ODPS之Tunnel上传下载
- 如何解决Bug并养成固定良好的解决思绪
- C++之继承
- 初涉json
- 负载均衡之反向代理
- AfxBeginThread的介绍/基本用法
- Android 左侧滑动窗口打开关闭监测
- 安卓 向服务器提交数据(方式:get、post、AsyncHttpClient )
- LeetCode : Excel Sheet Column Number