forum > Основной форум
Cushy Stock 1.7
azotov:
--- Цитата: SID от Августа 29, 2008, 03:30:55 pm ---
--- Цитата: Captain от Августа 29, 2008, 10:03:06 am ---Совершенству нет предела. Может быть и к этому придем. Это довольно сложно технически...
--- Конец цитаты ---
Мне как имеющем некоторое отношение к программированию сложным это не кажется. Подскажу, что копать надо в направлении антиспам алгоритма Байеса там принцип такой, что каждому письму на основе частотных алгоритмов присваивется весовое значение от 1 до 100 и собственно порог и реакцию на событие ставить сам пользователь. Алгоритм подробно описан и используется в куче программ. Из минусов там обучение, но нам именно в таком виде он и не нужен. Нужно просто вычислять некое значение и все.
--- Конец цитаты ---
Обучение можно сделать на нескольких добровольцах с большим портфолио - просто посмотреть, в каком проценте случаев однаковые названия, ключевые слова и др. признаки, соответствуют одинаковым фотографиям, и расставить пропорционально им веса для каждого из признаков (для каждого стока отдельно).
Кстати, в качестве хорошего признака для опознание фото - автоматическое сравнение локальной фотографии на диске и thumbnail на стоке по тому, что собственно на них изображено. Алгоритмов для определения того, являются ли фотографии идентичными, в сети хватает. Например, можно на библиотеку OpenCV посмотреть.
Captain:
Когда я говорю про сложность, то имею в виду прежде всего сложность поддержки. Код сайтов время от времени меняется. Сейчас я базируюсь на табличных представлениях, с листингами картинок. А так придется для каждой открывать ее страницу. Это не всегда приемлемо и ресурсозатратно.
P.S. По поводу алгоритмов сравнения картинок интересно. Где можно почитать теорию, алгоритмы посмотреть и т.д.? OpenCV посмотрю.
P.P.S. Вы текущую реализацию смотрели? Есть какие-то вопросы, замечания? Как вообще отрабатывает?
azotov:
--- Цитата: Captain от Августа 29, 2008, 05:09:09 pm ---Когда я говорю про сложность, то имею в виду прежде всего сложность поддержки. Код сайтов время от времени меняется. Сейчас я базируюсь на табличных представлениях, с листингами картинок. А так придется для каждой открывать ее страницу. Это не всегда приемлемо и ресурсозатратно.
--- Конец цитаты ---
Заходить для каждой фотографии на ее страницу я бы тоже не стал. Но для сравнения изображений вполне возможно получится обойтись и совсем мелкими фотками из листинга. Ну или попробовать исходя из имен файлов мелких фоток вычислять имена крупных.
--- Цитировать ---P.S. По поводу алгоритмов сравнения картинок интересно. Где можно почитать теорию, алгоритмы посмотреть и т.д.? OpenCV посмотрю.
--- Конец цитаты ---
Ссылки на конкретные ресурсы не дам, я сам в этой области больше занимался системами распознавания образов, да и то пользовался готовыми функциями и слишком глубоко в алгоритмы не вдавался. Насколько я знаю, есть как минимум два алгоритма:
1)обе фотографии приводятся к одинаковому (небольшому!) размеру в пикселях и переводятся в ч/б. После чего в примитивном случае просто считается среднеквадратичное отклонение яркости пикселей, а в качестве "продвинутого" алгоритма сравниваются специальные моменты яркости подобно тому, как можно посчитать моменты инерции для двумерной фигуры из материала переменной плотности.
2)Сравниваются гистограммы изображений.
В принципе эти два алгорится дополняют друг друга.
В библиотеке OpenCV, насколько я помню, стоит обратить внимание на функции MatchShapes и CompareHist соответственно.
--- Цитировать ---P.P.S. Вы текущую реализацию смотрели? Есть какие-то вопросы, замечания? Как вообще отрабатывает?
--- Конец цитаты ---
Пока не смотрел. На Шаттере я наконец-то прошел экзамен всего несколько дней назад и тестировать программу всего на десятке фотографий не стал. Вот когда побольше фоток туда загружу, тогда попробую.
Captain:
Гистограммами сейчас вот как раз занимаюсь... Я правда хотел автоматически оценивать при их помощи пересветы и порчие дефекты. Ну и для сравнения картинок можно их применить будет...
Captain:
Кстати, Cushy Stock обновился до 1.8.7
Появилась локализация (да-да, теперь есть русский язык), добавился импорт портфолио с практически всех поддерживаемых стоков, пофикшены разные баги, немного переработан интерфейс. При импорте портфолио, если у вас нет локально нужных фото, их превьюшки импортируются с сайта. Ну и разные другие вкусности добавились. Смотрите сами ;)
Навигация
Перейти к полной версии