Видимо я человек несовременный, поскольку технологические новшества достигают меня и начинают впечатлять (то бишь становиться реально полезными) где-то лет этак через пять после их появления на свет. Но это к делу не относится.
В купленом недавно устройстве Kindle Paperwhite
(2 поколения) не было русскоязычной поддержки. (Эка новость.) Но проблема решилась путём установления
некоторых примочек. Так что теперь можно всякие книги читать (даже на армянском), хотя на сей день до какой-либо арменизации устройства и установки более приятных для чтения шрифтов речи нет. Армянский, к сожалению, не приоритет для производителей электроники. Единственная компания, которая более-менее поддерживает армянский язык на своих устройствах это Samsung. Но мне это интересно чисто из принципа. Читаю я по армянски так себе, но, как говорится, "за державу обидно". Опять лирика.
Итак что с книгами делать Можно их покупать на Амазоне, но те книги которые они там продают мне, в основном, безразличны. Чтобы открючить дурацкие скринсейверы с рекламой книг пришлось связываться со службой поддержки -- они что-то там щёлкнули у себя в системе, и в ту же минуту вся эта реклама заменилась изображениями карандашей, ластиков, и разных букв. Это радует, хотя конечно и беспокоит: если они так ловко там всё это делают, что им мешает чего-нибудь ещё напортачить на купленом мною у них устройстве? Или "куплено" понятие относительное в этом мире. Опять же философия с примесью апокалиптики.
О чём это я. Да. В сети куча интересных текстов, но они в формате HTML. Если бы этот формат был просо HTML было бы нормально, однако зачастую документы эти выкладываются в сеть через Microsoft Word, который делает из нормального текста что-то ужасное (добавляет всяческий ненужный мусор). Чтобы почистить документы пришлось использовать программу
HTML Tidy. Через командную строку обработка страниц шла примерно так
tidy -f errs.txt -utf8 -bare -clean --drop-empty-paras yes --drop-font-tags yes --quote-nbsp yes --quote-marks yes --quote-ampersand yes --word-2000 yes index.html > t_index.html
Но даже после этого в шапку (head) каждой страницы приходилось вручную вставлять строчку
Иначе браузер (Firefox) изображал кракозябры.
Результат получался более-менее удобоваримый.
Поскольку Kindle Paperwhite нормально воспринимает либо собственный формат, либо MOBI я воспользовался услугами замечательного софта
Calibre. С помошью этого уникального набора полезных программ довольно просто перевести книгу из HTML в другие форматы. Правда, как и везде, к особенностям среды надо привыкать. Так например HTML книга при добавлении в Calibre автоматически сжимается (zip) и далее используется как основа для перевода в прочие форматы. В последней версии автор программы
Kovid Goyal добавил редактор EPUB, формата который используется в iBooks и других устройствах (но назло всем не в Kindle). Таким образом книжка может быть дополнительно отшлифована уже с помощью этого встроенного редактора. (Существует похожий редактор под названием
Sigil, но в каждом из них свои тараканы особенности). Чтобы Calibre правильно перевела из отредактированного и почищенного формата EPUB в приемлимый для Kindle формат MOBI потребовалось удалить начальный zip архив. И книга получилась как надо.
Процесс довольно долгий, но иначе чтение книг становится делом болезненным. Терперь не могу nonsense.