PDA

Просмотр полной версии : НИУ ВШЭ диссертация 05.13.18


Amok
11.04.2012, 03:26
Диссертация по 05.13.18
http://www.hse.ru/data/2012/04/06/1251326683/KirillovAutoreferat2012fin2.pdf

Как вам данная диссертация?

Ink
11.04.2012, 06:51
Как вам данная диссертация?
Не нравится

badalek
11.04.2012, 10:15
1) Актуальность, на мой взгляд, оформлена хорошо.
2) Объект и предмет, по крайней мере по уровню конкретики соотносятся хорошо (на смысловом уровне не говорю, не специалист).
3) Цель сформулирована не совсем корректно: цель не разработка метода, а метод. (Цель не стрельба по мосту, а мост).
4) Задачи поставлены хорошо и выстроены в логической последовательности исследования.
5) В достоверности следовало бы подробнее указать экспериментальные средства.
6) Автор приводит различные примеры: это плюс.
7) Проведён анализ работоспособности программного комплекса: это плюс, однако я не увидел сравнения с другими программными комплексами, но думаю, что это подразумевается.
8) Полученных результатов приведено для кандидатской в избытке: нужно уметь выделить главное.
9) С публикациями у автора всё ОК.

Aspirantfm
11.04.2012, 10:23
Элементарная проверка показывает, что прибавочной стоимости (она же новый полезный результат) нет.
В остальном - нормальная работа.

badalek
11.04.2012, 10:26
Элементарная проверка показывает
А в чём проверка состоит?

что прибавочной стоимости
Какие критерии оценки?

Aspirantfm
11.04.2012, 10:57
А в чём проверка состоит?


Какие критерии оценки?

Вы видите в тексте сайт? вот сравните результаты по нему и результаты Яндекса. Результат не лучше Яндекса, значит нет прибавочной стоимости от его диссертации

Hogfather
11.04.2012, 10:59
Не моя тема, поэтому квалифицированно высказаться не берусь, но разве всё это давно не реализовано в том же Google?

Aspirantfm
11.04.2012, 11:08
Не моя тема, поэтому квалифицированно высказаться не берусь, но разве всё это давно не реализовано в том же Google?

это тема бесконечна, там нельзя "все давно реализовать". И самая популярная в настоящее время в журналах уровня ACM.

badalek
11.04.2012, 11:09
Вы видите в тексте сайт? вот сравните результаты по нему и результаты Яндекса. Результат не лучше Яндекса, значит нет прибавочной стоимости от его диссертации

Aspirantfm, тут 4 с лишним миллиона ответов против десяти ответов (по моему запросу (слову)). Если критерий оценки в этом сравнении, то данная диссертация действительно не даёт никакого эффекта, а наоборот (и в этом я с Вами полностью согласен).
Если же говорить о вопросе рациональной выборки вариантов, то тут можно подумать, но о проверке и критериях мне, как не специалисту, говорить пока трудно.

Aspirantfm
11.04.2012, 11:11
Aspirantfm, тут 4 с лишним миллиона ответов против десяти ответов (по моему запросу (слову)). Если критерий оценки в этом сравнении, то данная диссертация действительно не даёт никакого эффекта, а наоборот (и в этом я с Вами полностью согласен).
Если же говорить о вопросе рациональной выборки вариантов, то тут можно подумать, но о проверке и критериях мне, как не специалисту, говорить пока трудно.

критерий - не количество ссылок. а релевантность, т.е. соответствие запросу и расположение в рейтинге ответов.

badalek
11.04.2012, 11:21
критерий - не количество ссылок. а релевантность, т.е. соответствие запросу и расположение в рейтинге ответов.
То есть по Вашему мнению, по этому критерию разработанная система проигрывает яндексу?

Amok
11.04.2012, 11:27
Если честно, по автореферату меня смущает соотвествие требованиям специальности.
Практической пользы от диссерта действительно мало, он вместо 1 запроса генерирует тучу запросов, увеличивая в разы загрузку. Что явно будет не понравиться поисковым машинам.

badalek
11.04.2012, 11:31
Если честно, по автореферату меня смущает соотвествие требованиям специальности.
Практической пользы от диссерта действительно мало, он вместо 1 запроса генерирует тучу запросов, увеличивая в разы загрузку. Что явно будет не понравиться поисковым машинам.
Ну вот, к примеру я ищу понятие "система":
Разработанный продукт даёт 10 вариантов: http://www.aosengine.ru/
Яндекс даёт вот что: http://yandex.ru/yandsearch?text=%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0% BC%D0%B0&clid=40316&lr=2

Как мне это сравнивать и насколько объективным будет такое сравнение?

Amok
11.04.2012, 11:32
То есть по Вашему мнению, по этому критерию разработанная система проигрывает яндексу?

Может там что-то сломалось, но проигрывает.

На запрос из диссертации "Каковы успехи компании Intel за 2011 год?" Сумбурная выдача. Нужной ссылки нет, есть куча информации по связанным вопросам.

Яндекс выдает релевантную информацию. 2 ссылка.

Hogfather
11.04.2012, 11:33
Aspirantfm, видите ли, десять лет тому назад я решил задачу поиска по номенклатуре запасных частей военных кораблей с учетом возможных ошибок в чертежах, названиях и семантики запросов, но я не видел в этом научной новизны. Может быть, зря...
Сейчас я занимаюсь несколько иным, но функционал, описанный в автореферате, я использую в запросах Google, поэтому и возник вопрос об отличиях от существующего. А что тема бесконечна я прекрасно понимаю, поскольку, например, полного распознавания речи или безошибочных переводов мы пока не имеем.

Amok
11.04.2012, 11:34
Ну вот, к примеру я ищу понятие "система":
Разработанный продукт даёт 10 вариантов: http://www.aosengine.ru/
Яндекс даёт вот что: http://yandex.ru/yandsearch?text=%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0% BC%D0%B0&clid=40316&lr=2

Как мне это сравнивать и насколько объективным будет такое сравнение?

Есть методики оценки поисковых машин. Есть даже крупные системы, которые этим занимаются.
В данном случае, просто Яндекс стремиться прорекламировать свои новости, как Google стремиться везде впихнуть Google Plus.

http://analyzethis.ru/

badalek
11.04.2012, 11:39
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Aspirantfm
11.04.2012, 11:44
Сейчас я занимаюсь несколько иным, но функционал, описанный в автореферате, я использую в запросах Google

Как Вы его используете в запросах гугла ?

Добавлено через 2 минуты
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

в работе предлагается осуществить предварительную обработку запросов, разделив на несколько подзапросов к яндексу , затем сшить результат. Сравнить естественно нужно с яндексом. Так как это попытка улучшить релевантность ответов яндекса

Amok
11.04.2012, 11:46
В поисковике разработанной поисковой машины указано, что поиск реализован с использованием Яндекс.XML: так что это в работе развивается некая подсистема системы Яндекс? В этом случае происходит сравнение системы с подсистемой? Корректно ли?

Да вроде бы корректно.
Там техника такая. Берется запрос, на его основе строятся уточнящие запросы. Затем все эти запросы подаются в существующую поисковую систему. Полученный ответ фильтруется.

Якобы после этого должно быть увеличение релевантности. Однако, поисковая система, такая как Яндекс или Гугл - фактически это черный ящик. Мы не знаем их аглоритмов (или те кто ходят на их конференции отдаленно имеют представление), более того они меняются. А тут попытка построить на основе такого черного ящика свою надстройку.
Ну и даже теоритически увеличение релевантности происходит за счет многократного увеличения числа запроосов.
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.
Ценность такой методики кажется мне сомнительной. Работа строится на работах научрука - это видно, может быть, там автор что-то добавил и расширил - лень уж совсем углубляться.

Hogfather
11.04.2012, 11:52
Как Вы его используете в запросах гугла ?
Тупо пишу запросы, например, как в автореферате, и получаю результат. Что-то не так? Насколько я знаю, поисковая машина Google уже понимает кое-что и это постоянно развивается [1] (http://online.wsj.com/article/SB10001424052702304459804577281842851136290.html?m od=WSJEUROPE_hpp_LEFTTopWhatNews)

Aspirantfm
11.04.2012, 11:53
Однако, поисковая система, такая как Яндекс или Гугл - фактически это черный ящик. Мы не знаем их аглоритмов (или те кто ходят на их конференции отдаленно имеют представление), более того они меняются. А тут попытка построить на основе такого черного ящика свою надстройку.
Ну и даже теоритически увеличение релевантности происходит за счет многократного увеличения числа запроосов.
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.

На самом деле это не страшно. ну и что, что черный ящик. Всегда можно на основе импульсной характеристики управлять системой. А ее можно рассчитывать и адаптироваться к ней, даже если она меняется. Так что идея вполне имеет право на существование, возможно, она бы дала неплохой результат, если бы было предложено что-то серьезное. Яндекс и Гугл сами монстры в семантическом поиске и улучшить их результаты можно не стандартным ходом. То, что предложено - не работает. В этом основной недостаток.

Добавлено через 1 минуту
Тупо пишу запросы, например, как в автореферате, и получаю результат. Что-то не так? Насколько я знаю, поисковая машина Google уже понимает кое-что и это постоянно развивается [1] (http://online.wsj.com/article/SB10001424052702304459804577281842851136290.html?m od=WSJEUROPE_hpp_LEFTTopWhatNews)

ну т.е. вы не поняли идею диссертации.

badalek
11.04.2012, 11:53
То есть нагрузка Яндекса в случае перехода на этот алгоритм увеличится в 20-40 раз.
А на что это в итоге влияет? На скорость работы компьютера (загрузки сети и т.п.)?
Сравнить естественно нужно с яндексом. Так как это попытка улучшить релевантность ответов яндекса
Понятно, ну что ж интересно (узнаю что-то новенькое).

Amok
11.04.2012, 11:56
А на что это в итоге влияет? На скорость работы компьютера (загрузки сети и т.п.)?

Понятно, ну что ж интересно (узнаю что-то новенькое).

Поиск очень ресурсоемкая задача, скорей всего понадобиться кратное увеличение мощности поискового кластера.

Hogfather
11.04.2012, 11:58
ну т.е. вы не поняли идею диссертации.
Вполне допускаю.

Цель исследования: разработать такой метод семантического
преобразования важных с практической точки зрения естественно-языковых
поисковых запросов в форму (множество производных запросов),
позволяющую традиционным системам поиска обнаружить наиболее
релевантные результаты, который предусматривает применение формальных
средств для описания (а) системы концептуальных единиц первичного
уровня, (б) логической структуры базы знаний для поддержки
преобразования запросов и поиска.

Вы уверены, что это не делается в поисковых машинах сейчас? Не добываем мы изюм из булочек?

Aspirantfm
11.04.2012, 12:03
Вы уверены, что это не делается в поисковых машинах сейчас? Не добываем мы изюм из булочек?

не уверены, само собой. но этого нет смысла обсуждать, так как это ноу-хау. может есть, а может и нет. Применение этого - не улучшает ситуацию, это не значит , что это есть, это значит, что то, что предложено не работает. Почему оно не работает - это надо либо смотреть диссертацию, либо разбираться в ноу-хау Гугла и Яндекса. Никто этим заниматься не будет.

andrewM
07.10.2012, 00:34
Aspirantfm,
А чего, так интересная тема.

А как сделали вывод что не работает?
Сколько запросов проверили?

Просто может методика на каких-то примерах и работает.
В поисковиках сейчас уже вроде как за % улучшений стали бороться.

Alarmod
07.10.2012, 07:23
Про релевантность. Обратите внимание на http://exactus.ru/ . Вот с чем надо сравнивать.