HTMLDOC(HTMLからPDF等への変換コマンド)
問題
htmldocというコマンドを見つけました。
HTMLをPDFやPS、epubファイルなどに変換できるようですが、使えますか?
答え
UTF-8、日本語に対応しておらず、日本語は文字化けしました(Ver. 1.8.25)。
バージョン1.9ではUTF-8に対応しているようですが、日本語に対応しているかどうか不明です。
コマンド例
$ htmldoc --format pdf14 --charset cp-1252 test.html > test.pdf
--format オプションで PDF1.4を指定。
--charset は以下が使用可能。
| charset | Character Set |
|---|---|
| cp-874 | Windows code page 874 |
| cp-1250 | Windows code page 1250 |
| cp-1251 | Windows code page 1251 |
| cp-1252 | Windows code page 1252 |
| cp-1253 | Windows code page 1253 |
| cp-1254 | Windows code page 1254 |
| cp-1255 | Windows code page 1255 |
| cp-1256 | Windows code page 1256 |
| cp-1257 | Windows code page 1257 |
| cp-1258 | Windows code page 1258 |
| iso-8859-1 | ISO-8859-1 |
| iso-8859-2 | ISO-8859-2 |
| iso-8859-3 | ISO-8859-3 |
| iso-8859-4 | ISO-8859-4 |
| iso-8859-5 | ISO-8859-5 |
| iso-8859-6 | ISO-8859-6 |
| iso-8859-7 | ISO-8859-7 |
| iso-8859-8 | ISO-8859-8 |
| iso-8859-9 | ISO-8859-9 |
| iso-8859-14 | ISO-8859-14 |
| iso-8859-15 | ISO-8859-15 |
| koi8-r | KOI8-R |
| utf-8 | UTF-8(バージョン1.8では未対応) |