spark on yarn的cpu使用
来源:互联网 发布:wingide 4 linux 编辑:程序博客网 时间:2024/05/18 02:08
在yarn-site.xml中,可以配置virutal core的个数,请注意不是physical core的个数,相关配置如下:
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>30</value>
<description>NodeManager总的可用虚拟CPU个数</description>
</property>
virutal core的概念是将所有physical cpu组成8个可调度的队列,linux使得有任务的时候每个physical cpu都能够调度,达到负载均衡。假设一台pc有16个physical cpu,当只有一个container的时候,这个container会使用这16个cpu,如果有2个container则每个container各占用8个physical cpu
spark运行的时候,通过--executor-cores指定的cpu个数都是vcore的个数,所以spark on yarn运行程序的时候,虽然通过--executor-cores指定vcore个数为1,但是所有的cpu都是很忙被占用。
yarn默认情况下,只根据内存调度资源,所以spark on yarn运行的时候,即使通过--executor-cores指定vcore个数为N,但是在yarn的资源管理页面上看到使用的vcore个数还是1. 相关配置在capacity-scheduler.xml 文件:
要想--executor-cores的是指起效,得修改这项配置为:这样就可以起效果了
cpu调度的时候,需要启动CGroups机制来达到cpu进程隔离的效果,但是windows不支持CGroups机制
需要验证,不知出处
- spark on yarn的cpu使用
- spark on yarn的cpu使用
- Spark On Yarn中spark.yarn.jar属性的使用
- Spark On YARN内存和CPU分配
- Spark On YARN内存和CPU分配
- Spark On YARN内存和CPU分配
- Spark On YARN内存和CPU分配
- Spark On YARN内存和CPU分配
- spark on yarn的理解
- spark on yarn 的安装
- Spark on yarn和Hadoop on yarn的区别
- Spark on Yarn遇到的几个问题
- Spark on Yarn遇到的几个问题
- Spark on Yarn遇到的几个问题
- Spark on Yarn可能遇到的问题
- Spark on yarn的内存分配问题
- spark on yarn 的那些坑
- Spark on yarn的内存分配问题
- IE上ORACLE OEM 证书错误 , 导航阻止,无法”继续浏览此网站”
- tensorboard报错
- 听见丨特朗普命令NASA让宇航员重返月球,最终前往火星 Airbnb考虑引入VR和AR技术 让租客预览房间
- 初创企业墓志铭:创业死亡榜背后的逻辑
- HTTP请求错误400、401、402、403、404、405、406、407、412、414、500、501、502解析
- spark on yarn的cpu使用
- 5天玩转C#并行和多线程编程 —— 第一天 认识Parallel
- OAuth2.0认证和授权原理
- 支付宝:web页面扫码支付、网站支付、支付宝即时到账 + springmvc
- LeetCode(3) -- Reverse Linked List
- 2小时学会springboot
- Qt使用系统代理访问网络
- 从LNMP到LORMP的高性能实践
- Spark dataframe 多列 合并成 vector