пятница, 23 ноября 2012 г.

Прокол Клоута с топиками

Огромное спасибо Косте за наводку). Краткое изложение статьи про конфуз с изменением топиков в Клоуте с моими разъяснениями и комментариями))).



Итак, начну по порядку. Есть такое понятие - онтология. У него есть общефилософский смысл, но в последнее время все большее распространение этот термин получает в смысле информационных наук. Итак,

В информационных технологиях и компьютерных науках под онтологией подразумевается эксплицитная, то есть явная, спецификация концептуализации, где в качестве концептуализации выступает описание множества объектов и связей между ними: англ. Ontology is the theory of objects and their ties[4]. Формально онтология состоит из понятий терминов, организованных в таксономию, их описаний и правил вывода.

Попытаюсь перевести это на более человеческий язык. Есть такое понятие, как База данных. Онтология - это разновидность Базы Знаний. Т.е. тут отдельно представлены термины/концепты, связи между ними, и правила вывода. Это довольно сложные структуры, и пока они не получили промышленного распространения. В основном онтологиями пока занимаются в университетских лабораториях и очень редко - в общедоступных проектах. 

Будущее поколение интернета называется Семантический Веб - Semantic Web. Разработку стандартов, интерфейсов, стратегии, языков, архитектуры, возглавляет с 2001 года консорциум W3C (это тот, кто разрабатывал хтмл5, стандарты графических форматов и т.п.)))). Это прекрасное будущее, когда Вы будете иметь "своего робота-агента", давать ему задание, и он - как человек, будет выполнять его автоматически, выполняя подчас довольно интеллектуальные задачи. Так вот базисом для Semantic Web являются именно онтологии. С их помощью программа (робот) будет понимать смысл. Тут задействованы исследования в таких областях наук, как искусственный интеллект, управление знаниями, логический вывод и др.

Научные сообщества очень тщательно разбираются в этой довольно новой области исследований, на данный момент есть уже определенные методологии построения онтологий, инструментарий, проверки целостности и непротиворечивости, выводимости и т.п. Но область до сих пор довольно слабо изучена и не устоялась. Один только стандарт представления онтологий OWL, и тот несколько лет назад полностью поменяли, изменив базовый подход, в результате получили язык OWL2.

С самого начала проект Клоут, гремя на весь мир своим проектом и получая инвестиции, заявлял, что они представляют "инновационный проект", и топики в нем представлены онтологиями. Само одно заявление и употребление данного термина вызывает уважение и особый интерес инвесторов. Это - самое острие науки, это - будущее.... и наверное это стоит дорого))).

Поскольку область моих научных интересов напрямую связано с онтологиями, я очень заинтересовалась этим проектом. Мне очень интересно - как они представляют свою онтологию, которая по их заявлениям имеет более 2 млн экземпляров. Десятки лет серьезной работы таких крупных проектов, как CYC и проч., занимающиеся построением онтологии, - а тут за пару лет! Я искала, гуглила... Несколько раз я обращалась непосредственно в Клоут с вопросом - покажите хотя бы фрагментарно Вашу онтологию. Но всякий раз мой запрос игнорировался. При этом, как Вы помните, запросы типа "У Вас в интерфейсе не работает..." - они довольно быстренько отвечали))). Понятно, что коммерческая тайна, но никакой информации в подтверждение их заявлению (да просто употребление самого термина - "мы используем онтологии") я не нашла.

Для построения онтологий обычно привлекают Инженера по Знаниям (ontology engineer) и эксперта в определенной предметной области (domain expert). Первый - знает основные правила, как надо строить онтологии, второй - знает свою область и отвечает за корректность терминов, правильность связей и т.п.

И вот, еще один конфуз. Клоут изменил топики! Они почистили некоторые термины и усовершенствовали!

И тут вдруг представители научных кругов такого серьезного коммюнити, как #BrainTumor и #BrainCancer (Опухоли мозга и Рак мозга), которые имеют представительство в разных соцсетях, обсуждения по этим хештегам, и соответственно кашки по этим топикам, выясняют, что таких топиков больше нет!))) Это что же - опухолей мозга не стало? Мир стал чище и светлей!) В статье автор публикует свою переписку с Клоутом по поводу исчезновения этих топиков. На определенной итерации Клоут извиняется и обещает исправить ошибку.... но не очень скоро. В переписке идут ссылки на "синонимы" таких терминов, которые сотрудник Клоута определил как синонимы, а на самом деле (с точки зрения специалиста в этой области) таковыми не являются, поскольку имеют отличия.

Вернусь к своему разъяснению. Если бы Клоут использовал действительно научный подход, и строил онтологию, то таких бы казусов не случилось. Ибо узкопрофильный специалист не позволил бы выкинуть важные термины. Да и при правильном построении и именно онтологии, добавление нового термина также не есть такая большая трудность.

В общем, эта статья - лишь еще одно подтверждение "использования научных терминов в корыстных целях"))). Мои эксперименты, примеры, приводимые в этом блоге, показывают всю сложность проблемы вычисления уровня влиятельности, а также довольно простые методы накрутки. Научности в Клоуте я пока так и не увидела.

Итак, мир, будь счастлив! Пока Опухоли мозга и Рак Мозга не существует! Есть только #SlightlyStoopid !)


Спасибо @KompassUkraine за пончик и стимулирование к написанию этого поста! Реально боюсь - все ли дочитают до конца))) - многа букафф.


Тем, кто использует материалы блога Опыта "в собственных" целях - не стесняйтесь, ставьте ссылки))) - а то мой рейтинг Клоута и Google PR пока слабоваты, и чаще слабее Ваших).

Ваша
@UkrainianLife)


Комментариев нет:

Отправить комментарий