Word文档到Asciidoc转换
来源:互联网 发布:淘宝的差评有什么影响 编辑:程序博客网 时间:2024/05/16 19:00
原文
Word文档的内容,需要背转换为Asciidoc。以下是我发现最有效的步骤:
1. 将Word文档保存为HTML2. 编码为UTF-83. 使用pandoc将HTML转换为AsciiDoc4. 使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西5. 使用Sublime Text 2执行任何剩余的格式
将Word文档保存为HTML
在Word中打开文档,然后另存为网页。保存时选择“仅保存显示信息到HTML”选项。从Word退出。
编码为UTF-8
在Sublime Text 2中打开html文件。重新打开UTF-8编码并保存文件:
Sublime Text 2重新打开编码
如果不重新编码为UTF-8,则下一步将失败并显示错误:
pandoc:无法解码字节’\ x6f’:Data.Text.Encoding.decodeUtf8:无效的UTF-8流
使用Pandoc将HTML转换为AsciiDoc
运行Pandoc。例如,以下命令将AsciiDoc文件file.asc转换为ConventionSheet.htm:
pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm
使用Sublime Text 2搜索和替换(使用一些正则表达式)去除疯狂的东西
奇怪的单引号需要去:
Sublime Text 2用单引号替换反引号,如果在Word中进行了审核,则审阅者的评论和更改可能会出现在HTML中。使用搜索删除这些,并在搜索字段中替换以下正则表达式:
\[line-through\]\*(.+)\*
当匹配行交叉线断裂时,可以使用?s正则表达式中的单行选项()进行搜索和替换:
(?s)\[line-through\]\*.(.*?)\*
使用Sublime Text 2执行任何剩余的AsciiDoc格式
在文档中等间隔任何正则表达式或其他特殊字符(这些将导致AsciiDoc解析器的问题)。
根据需要编辑AsciiDoc文档!请注意,GitHub现在本地显示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一样。
阅读全文
0 0
- Word文档到Asciidoc转换
- PPT到Word的文档转换(未果)
- PDF转换成Word文档
- PDF转换成Word文档
- Pdf文档转换成Word
- word文档英文字母大小写转换
- 将Powerpoint文档转换为Word文档
- PPT文档转换成Word文档
- 打开word文档到richtextbox
- Word转换成PDF文档怎么转换
- 从一个Word文档拷贝Header到另一个Word文档
- C#把Word文档转换成HTML
- 如何把word文档转换成html
- Word文档快速转换为PowerPoint文稿
- WORD文档转换成PDF格式
- Java 将Word文档转换Html
- Word文档快速转换为PowerPoint文稿
- WORD 文档转换为普通文本
- 解决Android 5.0以下出现 java.lang.NoClassDefFoundError,找不到类
- sqlite3 表里插入系统时间(时间戳)
- React-native 热更新之pushy!
- 数据库(1NF,2NF,3NF)
- Linux_用户、组和权限问题
- Word文档到Asciidoc转换
- mac本拿到手的那几天我做了什么
- Oracle ASM故障数据恢复方法和数据恢复过程详解
- 手机、平板也能构建APP(安装篇)
- 窗体部件效果之不规则窗体
- 关于前端代码基本命名规范与格式规范
- 三个动作就能养生健身!
- 微信支付-支付结果通知接收
- Android-AnimationDrawable自定义加载动画dialog