Небольшая статистика.
Пока ещё есть чуток времени играюсь с клиентом. Чуть дописал, багов поправил и новых добавил, как ведётся.
Судя по небольшому числу загруженных сообщений, оказывается вполне можно иметь полную базу локально у себя на машине.
На данный момент веду эксперименты с базой в ~17 тыс сообщений.
По моим прикидкам полная база будет содержать до 500 тыс сообщений (все форумы).
Это я загнул, конечно. Но для отработки алгоритмов поиска, сортировки и т.д. такого количества мало. Придётся самому добивать до нескольких миллионов.
Итак, посчитаем среднее количество байт, приходящееся на одно сообщение в несжатом файле mdb:
MessageSize = FileSize( default_v1.1.mdb ) / AllMessagesCount =
126832 Кб / 16790 ~= 7,6 Кб
В этом случае база из 500 000 сообщений будет занимать:
5*10^5 * 7,6 Кб / ( 1024 * 1024 ) ~= 3,62 Гб
Т.е. умещается на DVD современном и ещё остаётся :), а если пожать:
На картинке видно как 7z справился с задачей:
MessageSize = FileSize( default_v1.1.7z ) / AllMessagesCount =
4050 * 1024 байт / 16790 ~= 247 байт
Просто невероятно! 247 байт на одно сообщение. Хотя, конечно, это и не удивительно.
В этом случае база из 500 000 сообщений будет занимать:
5*10^5 * 247 байт / 1024 ~= 118 Мб
Одного DVD в этом случае достаточно, чтобы вести историю форума в течении всей жизни. А что там будет через 10 лет ещё не известно :)
--------------------------------------------------------------------------
Резюмирую. Хотя, конечно, как я как-то говорил, форум не заменит книжек,
но вот в качестве дополнительного источника информации очень даже не плох.
Вот если бы правила какие добавить, то можно было бы в примитивную экспертную систему преобразовать. On DVD.
Если заценить вопросы, то многие год от года повторяются.
Железо меняется, а теория - одна приходит, другая уходит, но многое и старое и новое уже давно придумано.
Почитаю про экспертные системы. Может поможет правильно оформлять окошко с расширенным поиском по базе.