TMX1.4b规范概述

来源:互联网 发布:mt管理器源码 编辑:程序博客网 时间:2024/06/03 19:10

TMX是一种用于翻译记忆库交换的格式。下面从两部分讨论TMX规范,


1. 字符集

TMX字符集支持UTF-16, UTF-8 和ISO-646 [US-ASCII] 。

只允许使用下列5种特殊字符实体的引用: &amp; (&), &lt; (<), &gt; (>), &apos; ('), and &quot; (")。


2. 结构

TMX文件包含在 <tmx> 根元素内。 <tmx> 元素包含两个元素:  <header> 和 <body>。

Header中的属性包括:

必选:

creationtoolcreationtoolversionsegtypeo-tmfadminlangsrclangdatatype.

可选:

o-encodingcreationdatecreationidchangedatechangeid.

Body有翻译单元( <tu>元素)集合组成,没有特殊的顺序要求。

每个 <tu> 元素必须至少包含一个  <tuv> 元素,每个 <tuv> 包含一个片段以及与片段的语言有关的信息。

文字保存在 <seg> 元素内,可选的<note> 和 <prop> 元素还能让你保存其他的 <tuv>的信息。

详细情况见下例:

 

  <tu   tuid="0002"   srclang="*all*" <!-- 可选-->
  >   <prop type="Domain">Cooking</prop> <!-- 可选-->   <tuv xml:lang="EN">    <seg>menu</seg>   </tuv>   <tuv xml:lang="FR-CA">    <seg>menu</seg>   </tuv>   <tuv xml:lang="FR-FR">    <seg>menu</seg>   </tuv>  </tu>


TMX文件内容的样例:

<?xml version="1.0"?><tmx version="1.4"> <header  creationtool="XYZTool"  creationtoolversion="1.01-023"  datatype="PlainText"  segtype="sentence"  adminlang="en-us"  srclang="EN"  o-tmf="ABCTransMem"
<!-- 可选内容
creationdate="20020101T163812Z" creationid="ThomasJ" changedate="20020413T023401Z" changeid="Amity" o-encoding="iso-8859-1"
 -->
>
<!-- 可选内容  <note>This is a note at document level.</note>  <prop type="RTFPreamble">{\rtf1\ansi\tag etc...{\fonttbl}</prop>  <ude name="MacRoman" base="Macintosh">   <map unicode="#xF8FF" code="#xF0" ent="Apple_logo" subst="[Apple]"/>  </ude>
 -->
 </header> <body>  <tu   tuid="0001"   datatype="Text"   usagecount="2"   lastusagedate="19970314T023401Z"  >   <note>Text of a note at the TU level.</note>   <prop type="x-Domain">Computing</prop>   <prop type="x-Project">P&#x00E6;gasus</prop>   <tuv    xml:lang="EN"    creationdate="19970212T153400Z"    creationid="BobW"   >    <seg>data (with a non-standard character: &#xF8FF;).</seg>   </tuv>   <tuv    xml:lang="FR-CA"    creationdate="19970309T021145Z"    creationid="BobW"    changedate="19970314T023401Z"    changeid="ManonD"   >    <prop type="Origin">MT</prop>    <seg>donn&#xE9;es (avec un caract&#xE8;re non standard: &#xF8FF;).</seg>   </tuv>  </tu>  <tu   tuid="0002"   srclang="*all*"  >   <prop type="Domain">Cooking</prop>   <tuv xml:lang="EN">    <seg>menu</seg>   </tuv>   <tuv xml:lang="FR-CA">    <seg>menu</seg>   </tuv>   <tuv xml:lang="FR-FR">    <seg>menu</seg>   </tuv>  </tu> </body></tmx>

具体的规范见:http://www.gala-global.org/oscarStandards/tmx/#body
0 0
原创粉丝点击