/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
Pandoc(通用文檔轉換器)是一個萬能文檔格式轉換器,幾乎支持目前已知的所有文檔格式之間的轉換,包括html格式、word格式、電子書格式、pdf格式等等,並且該軟件開源,項目github上托管,支持自定義格式轉換,如果你有編程基礎,可以使用lua編寫。
Pandoc是一個Haskell庫,用於將一種標記格式轉換為另一種格式,也是一個使用該庫的命令行工具。
Pandoc可以在許多標記和文字處理格式之間進行轉換,包括但不限於各種類型的Markdown、HTML、LaTeX和Word docx。有關輸入和輸出格式的完整列表,請參閱下麵的-from和-to選項。Pandoc還可以生成PDF輸出:請參見下麵的創建PDF。
Pandoc的增強版Markdown包括表格、定義列表、元數據塊、腳注、引用、數學等語法。請看下麵的Pandoc的Markdown。
Pandoc有一個模塊化的設計:它由一組讀取器和一組寫入器組成,前者解析給定格式的文本,並生成文檔的本機表示(抽象語法樹或AST),後者將本機表示轉換為目標格式。因此,添加一個輸入或輸出格式隻需要添加一個閱讀器或寫入器即可。用戶還可以運行自定義的pandoc過濾器來修改中間AST。
由於pandoc對文檔的中間表示方式不如它所轉換的許多格式之間的表現力強,因此不應該期望每一種格式和每一種其他格式之間都能實現完美的轉換。Pandoc試圖保留文檔的結構元素,但不保留格式細節,如邊距大小。而且有些文檔元素,如複雜的表格,可能不適合pandoc的簡單文檔模型。雖然從pandoc的Markdown到所有格式的轉換都力求完美,但從比pandoc的Markdown更有表現力的格式轉換可能會有損失。
如果沒有指定輸入文件,pandoc從標準輸入讀取。
若指定有多個輸入文件,可以以空格分割。
默認輸出是標準輸出,可以使用-o選項輸出到指定的文件中。
默認情況下,pandoc隻產生文件片段,不是一個包含頭尾的完整文件,如果需要產生一個獨立的文件,使用-s或--standalone選項。比如生成HTML文件。
有時候輸入文件可能是一個URI,此時pandoc可以通過http獲取內容。
如果指定多個輸入文件,pandoc也可以將多個文件合並轉換成一個文件。當然,輸入文件像EPUB、odt和docx這種,是不支持的
Pandoc 程序的命令使用方式為:
pandoc
其中??為輸入的內容,其輸入即可以來自文件,也可以來自標準輸入甚至網頁鏈接。而??為參數選項。主要的參數選項有:
-f、-r:指定輸入文件格式,默認為 Markdown;
-t、-w:指定輸出文件格式,默認為 HTML;
-o:指定輸出文件,該項缺省時,將輸出到標準輸出;
--highlight-style
輸入格式:
Markdown、格式輕量級標記語言、HTML、ReStructuredText、LaTeX、OPML、Org-mode、DocBook、Office Open XML (Microsoft Word .docx)
輸出格式:
Office Open XML(Microsoft Word .docx)、OpenDocument、HTML、Wiki markup、Adobe InDesign ICML文稿 ( Adobe InCopy文稿交換格式)、web-based slideshows、電子書(Epub格式等)、OPML多、種 TeX (以及 PDF).