深入了解webkit内核第一篇:JavaScript引擎深度解析
来源:互联网 发布:python split 多空格 编辑:程序博客网 时间:2024/05/22 06:29
看到HorkeyChen写的文章《[WebKit] JavaScriptCore解析--基础篇(三)从脚本代码到JIT编译的代码实现》,写的很好,深受启发。想补充一些Horkey没有写到的细节比如字节码是如何生成的等等,为此成文。
JSC对JavaScript的处理,其实与Webkit对CSS的处理许多地方是类似的,它这么几个部分:
(1)词法分析->出来词语(Token);
(2)语法分析->出来抽象语法树(AST:Abstract Syntax Tree);
(3)遍历抽象语法树->生成字节码(Bytecode);
(4)用解释器(LLInt:Low Level Interpreter)执行字节码;
(5)如果性能不够好就用Baseline JIT编译字节码生成机器码、然后执行此机器码;
(6)如果性能还不够好,就用DFG JIT重新编译字节码生成更好的机器码、然后执行此机器码;
(7)最后,如果还不好,就祭出重器--虚拟器(LLVM:Low Level Virtual Machine)来编译DFG的中间表示代码、生成更高优化的机器码并执行。接下来,我将会用一下系列文章描述此过程。
其中,步骤1、2是类似的,3、4、5步的思想,CSS JIT也是采用类似方法,请参考[1]。想写写JSC的文章,用菜鸟和愚公移山的方式,敲开JSC的冰山一角。
本篇主要描述词法和语法解析的细节。
一、 JavaScriptCore的词法分析器工作流程分析
W3C是这么解释词法和语法工作流程的:
词法器Tokenizer的工作过程如下,就是不断从字符串中寻找一个个的词(Token),比如找到连续的“true”字符串,就创建一个TokenTrue。词法器工作过程如下:
JavaScriptCore/interpreter/interpreter.cpp:
template <typename CharType>
template
<ParserMode mode> TokenType LiteralParser<CharType>::Lexer::lex(LiteralParserToken<CharType>& token)
{
while
(m_ptr < m_end && isJSONWhiteSpace(*m_ptr))
++m_ptr;
if
(m_ptr >= m_end) {
token.type = TokEnd;
token.start = token.end = m_ptr;
return
TokEnd;
}
token.type = TokError;
token.start = m_ptr;
switch
(*m_ptr) {
case
'['
:
token.type = TokLBracket;
token.end = ++m_ptr;
return
TokLBracket;
case
']'
:
token.type = TokRBracket;
token.end = ++m_ptr;
return
TokRBracket;
case
'('
:
token.type = TokLParen;
token.end = ++m_ptr;
return
TokLParen;
case
')'
:
token.type = TokRParen;
token.end = ++m_ptr;
return
TokRParen;
case
','
:
token.type = TokComma;
token.end = ++m_ptr;
return
TokComma;
case
':'
:
token.type = TokColon;
token.end = ++m_ptr;
return
TokColon;
case
'"'
:
return
lexString<mode,
'"'
>(token);
case
't'
:
if
(m_end - m_ptr >= 4 && m_ptr[1] ==
'r'
&& m_ptr[2] ==
'u'
&& m_ptr[3] ==
'e'
) {
m_ptr += 4;
token.type = TokTrue;
token.end = m_ptr;
return
TokTrue;
}
break
;
case
'-'
:
case
'0'
:
...
case
'9'
:
return
lexNumber(token);
}
if
(m_ptr < m_end) {
if
(*m_ptr ==
'.'
) {
token.type = TokDot;
token.end = ++m_ptr;
return
TokDot;
}
if
(*m_ptr ==
'='
) {
token.type = TokAssign;
token.end = ++m_ptr;
return
TokAssign;
}
if
(*m_ptr ==
';'
) {
token.type = TokSemi;
token.end = ++m_ptr;
return
TokAssign;
}
if
(isASCIIAlpha(*m_ptr) || *m_ptr ==
'_'
|| *m_ptr ==
'$'
)
return
lexIdentifier(token);
if
(*m_ptr ==
'\''
) {
return
lexString<mode,
'\''
>(token);
}
}
m_lexErrorMessage = String::format(
"Unrecognized token '%c'"
, *m_ptr).impl();
return
TokError;
}
经过此过程,一个完整的JSC世界的Token就生成了。然后,再进行语法分析,生成抽象语法树.
JavaScriptCore/parser/parser.cpp:
<span style=
"font-family: Arial, Helvetica, sans-serif;"
>PassRefPtr<ParsedNode> Parser<LexerType>::parse(JSGlobalObject* lexicalGlobalObject, Debugger* debugger, ExecState* debuggerExecState, JSObject** exception)</span>
{
ASSERT(lexicalGlobalObject);
ASSERT(exception && !*exception);
int
errLine;
UString errMsg;
if
(ParsedNode::scopeIsFunction)
m_lexer->setIsReparsing();
m_sourceElements = 0;
errLine = -1;
errMsg = UString();
UString parseError = parseInner();
。。。
}
UString Parser<LexerType>::parseInner()
{
UString parseError = UString();
unsigned oldFunctionCacheSize = m_functionCache ? m_functionCache->byteSize() : 0;
//抽象语法树Builder:
ASTBuilder context(
const_cast
<JSGlobalData*>(m_globalData),
const_cast
<SourceCode*>(m_source));
if
(m_lexer->isReparsing())
m_statementDepth--;
ScopeRef scope = currentScope();
//开始解析生成语法树的一个节点:
SourceElements* sourceElements = parseSourceElements<CheckForStrictMode>(context);
if
(!sourceElements || !consume(EOFTOK))
}
举例说来,根据Token的类型,JSC认为输入的Token是一个常量声明,就会使用如下的模板函数生成语法节点(Node),然后放入ASTBuilder里面:
接下来,就会调用BytecodeGenerator::generate生成字节码,具体分下节分析。我们先看看下面来自JavaScript的一个个语法树节点生成字节码的过程:
JavaScriptCore/bytecompiler/NodeCodeGen.cpp:
RegisterID* BooleanNode::emitBytecode(BytecodeGenerator& generator, RegisterID* dst)
第一时间获得博客更新提醒,以及更多技术信息分享,欢迎关注个人微信公众平台:程序员互动联盟(coder_online)
1.直接帮你解答wekit技术疑点
2.第一时间获得业内十多个领域技术文章
3.针对文章内疑点提出问题,第一时间回复你,帮你耐心解答
4.让你和原创作者成为很好的朋友,拓展自己的人脉资源
扫一扫下方二维码或搜索微信号coder_online即可关注,我们可以在线交流。
引用:
1 https://www.webkit.org/blog/3271/webkit-css-selector-jit-compiler/
2 http://blog.csdn.net/horkychen/article/details/8928578
- 深入了解webkit内核第一篇:JavaScript引擎深度解析
- 深入了解webkit内核第一篇:JavaScript引擎深度解析
- 深入理解webkit内核系列第二篇:JavaScript引擎深度解析
- 深入了解javascript第一篇实现篇
- 深入理解webkit内核系列第一篇:如何快速编译
- [WebKit内核] JavaScript引擎深度解析--基础篇(一)字节码生成及语法树的构建详情分析
- 深度解析 ES6 第一篇
- cocos2d-x box2d物理引擎深入研究 第一篇续
- MySQL存储引擎之Spider内核深度解析
- MySQL存储引擎之Spider内核深度解析
- MySQL存储引擎之Spider内核深度解析
- 第一篇 对Javascript中原型的深入理解
- Google Chrome 的内核引擎 WebKit 介绍
- Google Chrome 的内核引擎 WebKit 介绍
- Google Chrome 的内核引擎 WebKit 介绍
- Google Chrome 的内核引擎 WebKit 介绍
- Google Chrome 的内核引擎 WebKit 介绍
- 深入解析JavaScript一:你真的了解作用域?
- Warning. Log sequence in archive filename wrapped to fix length as indicated by %S in LOG_ARCHIVE_F
- Ubuntu 14.04升级到15.04
- 制作动态根文件系统
- 第四周 项目4-指向学生类的指针
- javascript判断当前浏览器类型及版本号
- 深入了解webkit内核第一篇:JavaScript引擎深度解析
- HDOJ 2074 叠筐
- 在CentOS 6上搭建PPTP类型VPN
- 【蓝桥训练】历届试题 剪格子
- 一键安装PPTPD VPN 脚本
- 关于 redis、memcache、mongoDB 的对比
- UIImageView的创建(React Native)
- Android为textView设置setText的时候报错
- genfromtxt对文件进行数据处理