С давних пор пользуюсь для чтения электронных книг замечательной программкой FBReader. Особо мне нравилось то, что он мог на основе параметров пользователя оформлять книги, которые находятся в простом TXT файле.
Например, люди, которые делают OCR могут использовать следующие способы для выделения абзацев:
- длинные строки, новый абзац с новой строки - такое правда встречается редко
- в начале обзаца строка имеет отступ а 1-2-3 и т.д. пробелов или табуляций
- абзацы разделены пустой строкой Второй и третий случай - наиболее частые, а сам текст обычно выравнен на 80 символов, что бы можно было читать в DOS-терминале
Так вот, в программе можно задать, как разбивать на абзацы, в остальных случаях перевод строки будет игнорироваться и строки будут склеиваться, что удобно - при любом удобном шрифте, у нас не будет рваных краем, затрудняющих чтение.
Второй вариант, разделение глав, тут обычный случай: по окончании главы 2 и более пустые строки, после заголовка одна пустая строка - самый частый случай. Программа на основе таких данных может строить оглавление и осуществлять быстрый переход, что является достаточно удобным функционалом.
Конечно, данные критерии не покрывают абсолютно все случаи, но большинство - это точно.
Теперь о проблеме: в какой-то момент поломалось форматирование TXT файлов, с разделением абзацев по отступу первой строки, проявлялось так:
Отступ имела первая строка азбаца, после чего азцаз закрывался и вторая строка абзаца так же печаталась с новой строки с отступом, и это очень сильно резало глаза.
Сегодня дошли руки покопаться в исходниках, благодаря ну очень внятной структуре, разобраться много времени не заняло, да и исправления можно сказать косметические, вот патч:
--- ./fbreader/src/formats/txt/TxtBookReader.cpp.orig 2010-01-26 01:33:14.083167173 +1000
@@ -27,7 +27,8 @@
void TxtBookReader::internalEndParagraph() {
if (!myLastLineIsEmpty) {
1. myLineFeedCounter = 0;
+ myLineFeedCounter = -1; /* Fixed by Hatred: zero value was break LINE INDENT formater -
+ second line print with indent like new paragraf */
}
myLastLineIsEmpty = true;
endParagraph();
@@ -76,7 +77,9 @@
((myFormat.breakType() & PlainTextFormat::BREAK_PARAGRAPH_AT_EMPTY_LINE) && (myLineFeedCounter > 0));
if (myFormat.createContentsTable()) {
1. if (!myInsideContentsParagraph && (myLineFeedCounter == myFormat.emptyLinesBeforeNewSection() + 1)) {
+ /* Fixed by Hatred: remove '+ 1' for emptyLinesBeforeNewSection, it looks like very strange
+ when we should point count of empty string decrised by 1 in settings dialog */
+ if (!myInsideContentsParagraph && (myLineFeedCounter == myFormat.emptyLinesBeforeNewSection())) {
myInsideContentsParagraph = true;
internalEndParagraph();
insertEndOfSectionParagraph();
Или альтернативная ссылка: http://codepad.org/GO5GIN7Y
Сейчас попробуем запостить разработчикам.
UPD: собственно: http://groups.google.com/group/fbreader/browse_thread/thread/a0f77eb79add8571?hl=en