Готов выслушать ваши прделожения по стоимости исполнения следующего проекта:
Приложение должно обеспечивать:
1.Хранение информации о примерах текстовых документов.
2.Просмотр и модификацию содержимого базы данных примеров текстовых документов.
3.Построение функции определения степени «ключевизны» слова.
4.Выделение ключевых слов произвольного документа.
5.Хранение, просмотр и редактирование древовидного рубрикатора, позволяющего организовать каталоги и подкаталоги документов.
6.Хранение ключевых слов для каждой рубрики.
Кратко смысл таков: есть документ, мы находим в нем ключевые слова, просматриваем ключевые слова по рубрикам (некоторое начальное количество рубрик задает пользователь), при достаточном совпадении кидаем документ в эту рубрику.
Для данного проекта есть описание и анализ задачи. Необходимо собственно реализация c построением базы в interbase или mysql ну и тд...
Я еще не решил отадм проект или сделаю сам, так что пока просчитываю варианты.
Слушаю ваши предложения цены (можно в приват)
одно маленькое но, Delphi называется. Планируется реализация в дельфях. Но все возможно, я благодарен всем кто откликнулся, буду думать
[Ответ]
doXtor 17:44 14.08.2007
напиши чуть развернутее, языком по-русски..... а то смысл того, чо в итоге должно происходить - не прослеживается [Ответ]
Смысл написать прогу, которая обрабатывала бы документы текстовые , выделяла из них ключевые слова по определенным правилам(пока основа - частотный словарь с исключением символов, которые не могут являться ключевыми словами (точки, символы + = и тд...) и заносила документы по рубрикам (опять же по некоторому алгоритму зависящему от ключевых слов (некоего коэффициента) и того же коэффициента ключевых слов документов находящихся уже в рубрике).
Начальные данные, на основе которых будет происходить занесение по рубрикам (что-то вроде шаблона) заполняется экспертом (программистом 8)).
+ База в интербейзе (желательно)
Еще вопросы?
[Ответ]
doXtor 01:27 15.08.2007
Strucka, я походу дебил..... никуя не понял понял тока что есть куча текстовых документов (т.е. в тхт формате) из них нужно выбирать из них какие-то слова, которые уже есть в какомто словаре без каких-то символов, затем по какомуто правилу распределять эти доки по каталогам. Причем словарь здесь - не понятно.... что такое частотный словарь - совсем не понятно.
Сообщение от Strucka:
по некоторому алгоритму зависящему от ключевых слов (некоего коэффициента) и того же коэффициента ключевых слов документов находящихся уже в рубрике
вот эту фразу вообще раз 8 читал и никуя ни въехал.....
Strucka, без обид, ты сам-то четко понимаешь чо сделать нада?
MR_Romik, ты чонить понял?
Сообщение от Strucka:
Еще вопросы?
походу все. какие тут могут быть вопросы....... под чем базу писать - мне нацрать, хоть под иб, хоть под парадоксом, хоть под SQL хоть под чем, вопрос в том, что всетаки должно в ней происходить, а я видимо из-за своей тупости въехать в это совсем нимагу [Ответ]
-=Женек=- 07:57 15.08.2007
doXtor,
неужели непонятно, еще один человек захотел сделать "свой яндекс" и грести бабло до конца жизни. Но как всегда, хочется, чтобы напрягся кто-то другой. Когда речь зайдет о цене он будет удивленно спрашивать "а почему так дорого?". Зайди на freelance.ru там таких пруд пруди.
Если я ошибаюсь, мои извинения форумцу Strucka[Ответ]
MR_Romik 08:26 15.08.2007
doXtor, НЕ только ты дебил, я неверное тоже дебил! -=Женек=-, Если это то..., то смысл это творить на дельфях и в интербезе?
Помоему просто смахивает на задание из института(там практика или еще что то), я прав [Ответ]
-=Женек=- 08:41 15.08.2007
MR_Romik, а что, обязательно скриптованый язык надо использовать? Я одно время для локалки делал поисковую систему ( так и не доделал ((( ) - так я в C++ Builder делал и мне это казалось более рациональным.
[Ответ]
-=Женек=- 08:41 15.08.2007
Сообщение от :
Помоему просто смахивает на задание из института
Сообщение от MR_Romik:
Помоему просто смахивает на задание из института(там практика или еще что то), я прав
Совершенно верно. 8) Именно из института 8)
Под декстовыми документами понималось не документы с расширением ткст, а документы , которые могут содержать текст (там вордовские файлы итд).
Что должна делать прога:
1.Обрабатывать документ и выделять ключевые слова по след принципу: создать частотный словарь (посчитать количество слов). При этом из выборки должны быть исключены некоторые "слова" (типа ы а ц у к ( ) * & # . < / ) ,а затем полученные данные разделить на кол-во слов в документе (общее кол-во) (пока такой способ).
2. Вычислять коэфф. ключевизны слова (об этом подробнее могу выслать файло, потому как долго объяснять)
3. ПО вычислениям в 1. и 2. оперделять документ в рубрику по принципу:
а)сначала вручную создается рубрика и в нее записывается выбранный экспертом документ, и для него программно определяется 1. и 2.; а для рубрики зааются вручную ключевые слова по которым в нее определять документы (ну и считаются 1. и 2. для выброанного списка таких слов по всем документам , которые находятся в рубрике).
б)новый документ после 1. и 2. проходит сравнение своим списком ключевых слов с таким списком у рубрик, и заносится в соответствующую.
4. Если юзер хочет новую рубрику, то он должен задать для нее начальные параметры (см.3.а)
5. Ну и юзерь естесно может осуществить поиск(по рубрикам, или задав набор слов ему в качестве рез-та список доков , которые могли бы его заинтересовать, ну и рубрика где этот док лежал.)
Никаких окончаний , коэфф. релевантности слов и предложений не надо (это по поводу мини яндекса *))
Блин мне уже кажется, что легче сделать это самому 8). Жаль времени мало....
Еще вопросы? По-прежнему жду предложений о цене или вопросв (мона в личку).
[Ответ]
MR_Romik 23:01 15.08.2007
А у тебя пункт 3 два раза повторяеться)))
Если честно я еще сильнее запутался)))))) )))
В каком Вузе это задают?
Рассмотри решение от фирмы 1с
Называеться "1с-архив". Полностью удовлетворяте Твоим условиям+куча бонусов. Знаком не по наслышке, имею опыт в установке и настройке.
Стоит от 400$ версия 2.1 и от 900$ до 3000$ версия 3,0 (последняя цифирь в 3000$ может быть завышена, давно не смотрел у них на сайте.)
[Ответ]
MR_Romik 08:46 16.08.2007
RDS,
Я прям ору, человеку это задали в институте, ща прям он возьмет и заплатит 400-900 баков, тогда уж сразу проще всю ссесию купить!))))
[Ответ]
-=Женек=- 11:13 16.08.2007
Сообщение от :
человеку это задали в институте, ща прям он возьмет и заплатит 400-900 баков
... а препод скажет - нас не наёбёшь, ты сп...дил это у 1С )))))
[Ответ]
Почет тебе и хвала!
Тогда в чем проблема то?
[Ответ]
Ant0 15:30 21.08.2007
Сообщение от Strucka:
а документы , которые могут содержать текст (там вордовские файлы итд).
покажите мне тупому, в каком месте в вордовском файле содержится текст?! 8-O
ИМХО:
ТЗ ужастнее не придумать! Всегда удивлялся тому, как институтские преподы могут извратить задачку, чтобы никто не догадался что тама задано.... Это наверно от того, что сами никуя не програмили комерческих приложений... :-/
[Ответ]
shuri 17:15 21.08.2007
Сообщение от Ant0:
покажите мне тупому, в каком месте в вордовском файле содержится текст?! 8-O