Text-Processing
列印UTF-8(包括中文)文本
我正在嘗試列印大量(幾兆字節)由中文和拉丁字元組成的 UTF-8 編碼文本(可能還有一些其他字元)。我想將它列印在每頁的幾列中,使用非常小的、緊湊的字型,最好控制行距。我很喜歡列間線,但我可以沒有它們。目的是列印到 PDF 以進行傳輸,以及列印到紙張上。
我試過
enscript
anda2ps
,但這些都不支持 Unicode。我也嘗試過
paps
,但這會產生無法有效 PDF 的點陣圖輸出,而且看起來也很糟糕。有沒有一種現代方法可以列印這樣的 UTF-8 文本,而無需求助於在 Python 中手動建構它?
Cedilla是一個文本到 postscript 轉換器,類似於 enscript 和 a2ps,具有良好的 Unicode 支持,但配置可能性要少得多。我不認為 Cedilla 可以多列。
如果您想更好地控制格式,可以使用LaTeX。LaTeX 對超過 8 位的支持有點問題,但現在有工具可以相當輕鬆地排版中文。這是一些未經測試的程式碼,靈感來自如何在 LaTeX 中輸入一種中文?並包含來自我們姊妹網站上關於 TeX的 .txt 的數據。您可以通過更改
\VerbatimInput
從fancyvrb 包傳遞的選項來自定義文本的外觀。cat <<'EOF' >driver.tex \documentclass[UTF8]{ctexart} \usepackage{multicol} \usepackage{fancyvrb} \setlength\columnseprule{.5pt} \begin{document} \begin{multicols}{2} \VerbatimInput[fontfamily=cmr]{stuff.txt} \end{multicols} \end{document} EOF pdflatex driver.tex