Text-Processing

列印UTF-8(包括中文)文本

  • November 20, 2013

我正在嘗試列印大量(幾兆字節)由中文和拉丁字元組成的 UTF-8 編碼文本(可能還有一些其他字元)。我想將它列印在每頁的幾列中,使用非常小的、緊湊的字型,最好控制行距。我很喜歡列間線,但我可以沒有它們。目的是列印到 PDF 以進行傳輸,以及列印到紙張上。

我試過enscriptand a2ps,但這些都不支持 Unicode。

我也嘗試過paps,但這會產生無法有效 PDF 的點陣圖輸出,而且看起來也很糟糕。

有沒有一種現代方法可以列印這樣的 UTF-8 文本,而無需求助於在 Python 中手動建構它?

Cedilla是一個文本到 postscript 轉換器,類似於 enscript 和 a2ps,具有良好的 Unicode 支持,但配置可能性要少得多。我不認為 Cedilla 可以多列。

如果您想更好地控制格式,可以使用LaTeX。LaTeX 對超過 8 位的支持有點問題,但現在有工具可以相當輕鬆地排版中文。這是一些未經測試的程式碼,靈感來自如何在 LaTeX 中輸入一種中文?包含來自我們姊妹網站上關於 TeX的 .txt 的數據。您可以通過更改\VerbatimInputfancyvrb 包傳遞的選項來自定義文本的外觀。

cat <<'EOF' >driver.tex
\documentclass[UTF8]{ctexart}
\usepackage{multicol}
\usepackage{fancyvrb}
\setlength\columnseprule{.5pt}
\begin{document}
\begin{multicols}{2}
\VerbatimInput[fontfamily=cmr]{stuff.txt}
\end{multicols}
\end{document}
EOF
pdflatex driver.tex

引用自:https://unix.stackexchange.com/questions/101844