Pandoc官方版是一款通用的文档转换软件,Pandoc最新版支持转换的格式非常多,常用的有 txt、docx、html、pdf、md、pptx等,Pandoc软件还可以在许多标记和文字处理格式之间进行转换,包括但不限于各种类型的Markdown、HTML、LaTeX和Word docx。
Pandoc官方版是一个Haskell库,用于将一种标记格式转换为另一种格式,也是一个使用该库的命令行工具。
Pandoc可以在许多标记和文字处理格式之间进行转换,包括但不限于各种类型的Markdown、HTML、LaTeX和Word docx。有关输入和输出格式的完整列表,请参阅下面的-from和-to选项。Pandoc还可以生成PDF输出:请参见下面的创建PDF。
Pandoc的增强版Markdown包括表格、定义列表、元数据块、脚注、引用、数学等语法。请看下面的Pandoc的Markdown。
Pandoc有一个模块化的设计:它由一组读取器和一组写入器组成,前者解析给定格式的文本,并生成文档的本机表示(抽象语法树或AST),后者将本机表示转换为目标格式。因此,添加一个输入或输出格式只需要添加一个阅读器或写入器即可。用户还可以运行自定义的pandoc过滤器来修改中间AST。
由于pandoc对文档的中间表示方式不如它所转换的许多格式之间的表现力强,因此不应该期望每一种格式和每一种其他格式之间都能实现完美的转换。Pandoc试图保留文档的结构元素,但不保留格式细节,如边距大小。而且有些文档元素,如复杂的表格,可能不适合pandoc的简单文档模型。虽然从pandoc的Markdown到所有格式的转换都力求完美,但从比pandoc的Markdown更有表现力的格式转换可能会有损失。
markdown 转换为 html:pandoc README.md -o README.html
Markdown 转 word:pandoc README.md -o README.docx
markdown 转换为 pdf:pandoc README.md –latex-engine=xelatex -o README.pdf(latex之前是双短横线)
输入格式:
Markdown、格式轻量级标记语言、HTML、ReStructuredText、LaTeX、OPML、Org-mode、DocBook、Office Open XML (Microsoft Word .docx)
输出格式:
Office Open XML(Microsoft Word .docx)、OpenDocument、HTML、Wiki markup、Adobe InDesign ICML文稿 ( Adobe InCopy文稿交换格式)、web-based slideshows、电子书(Epub格式等)、OPML多、种 TeX (以及 PDF).
-s:生成有头尾的独立文件(HTML,LaTeX,TEI 或 RTF);
-S:聪明模式,根据文件判断其格式;
--self-contained:生成自包含的文件,仅在输出 HTML 文档时有效;
--verbose:开启 Verbose 模式,用于 Debug;
--list-input-formats:列出支持的输入格式;
--list-output-formats:列出支持的输出格式;
--list-extensions:列出支持的 Markdown 扩展方案;
--list-highlight-languages:列出支持代码高亮的编程语言;
--list-highlight-styles:列出支持的代码高亮主题;
-v、--version:显示程序的版本号;
-h、--help:显示程序的帮助信息。
虽然 Pandoc 提供了用于指定输入输出格式的参数,但是很多时候该参数不必使用。Pandoc 已经足够聪明到可以根据文件名判断输入输出格式,所以除非文件名可能造成歧义,否则这两个参数都可以省略。
网友评论