286
Основной форум / Re: Cushy Stock 1.7
« : Августа 29, 2008, 04:20:57 pm »Совершенству нет предела. Может быть и к этому придем. Это довольно сложно технически...Мне как имеющем некоторое отношение к программированию сложным это не кажется. Подскажу, что копать надо в направлении антиспам алгоритма Байеса там принцип такой, что каждому письму на основе частотных алгоритмов присваивется весовое значение от 1 до 100 и собственно порог и реакцию на событие ставить сам пользователь. Алгоритм подробно описан и используется в куче программ. Из минусов там обучение, но нам именно в таком виде он и не нужен. Нужно просто вычислять некое значение и все.
Обучение можно сделать на нескольких добровольцах с большим портфолио - просто посмотреть, в каком проценте случаев однаковые названия, ключевые слова и др. признаки, соответствуют одинаковым фотографиям, и расставить пропорционально им веса для каждого из признаков (для каждого стока отдельно).
Кстати, в качестве хорошего признака для опознание фото - автоматическое сравнение локальной фотографии на диске и thumbnail на стоке по тому, что собственно на них изображено. Алгоритмов для определения того, являются ли фотографии идентичными, в сети хватает. Например, можно на библиотеку OpenCV посмотреть.