Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/variables.php on line 13

Warning: session_start() [function.session-start]: Cannot send session cookie - headers already sent by (output started at /home/edoggy/domains/sabrik.com/public_html/variables.php:13) in /home/edoggy/domains/sabrik.com/public_html/engine/site_top.php on line 2

Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent (output started at /home/edoggy/domains/sabrik.com/public_html/variables.php:13) in /home/edoggy/domains/sabrik.com/public_html/engine/site_top.php on line 2
История Yandex
Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/variables.php on line 13
 Главная
 Форум
 Акция 'Чёрная лента'
 Блог
 Статьи
 Объявления
 Ссылки
 Еврейский календарь
 Информация
 Карта железных дорог
 Игры
 Компьютеры
 Гороскоп
 Бизнес калькулятор
 Кнопкообмен
 Новое на сайте
 К сведению









Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/variables.php on line 13

Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/variables.php on line 13

Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/modules/comments/config.php on line 9

Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/modules/articles/config.php on line 10

Deprecated: Function mysql_list_tables() is deprecated in /home/edoggy/domains/sabrik.com/public_html/variables.php on line 13
История Yandex

Предыстория
История компании «Яндекс» восходит к 1990 году, когда в компании «Аркадия», возглавляемой Аркадием Борковским и Аркадием Воложем, начались разработки поискового программного обеспечения. Сайт «Яndex» появился в Интернете в 1996 году, после того как руководством CompTek и разработчиками системы было принято решение о дальнейшем развитии поисковых технологий, ориентированных на широкую аудиторию пользователей Интернета.

За два года работ были созданы две информационно-поисковые системы — Международная Классификация Изобретений, 4 и 5 редакция, а также Классификатор Товаров и Услуг. И до сих пор, особенно по весне, в CompTek обращаются изобретатели-одиночки в надежде на появление новых редакций. Обе системы работали под DOS и позволяли проводить поиск, выбирая слова из заданного словаря, с использованием стандартных логических операторов.

В 1993 году «Аркадия» стала подразделением CompTek. 1993–1994 годы в результате его сотрудничества с лабораторией Ю. Д. Апресяна (Институт Проблем Передачи Информации РАН) программные технологии были существенно усовершенствованы. В частности, словарь, обеспечивающий поиск с учетом морфологии русского языка, занимал всего 300Кб, то есть целиком грузился в оперативную память и работал очень быстро. С этого момента пользователь мог задавать в запросе любые формы слов.

На основе новой технологии в 1994 году был создан «Библейский компьютерный справочник» (информационно-поисковая система, обеспечивающая работу с Синодальным переводом Ветхого и Нового Заветов).

В 1995 году стартовал проект «Академическое издание классиков на CD ROM», разрабатываемый совместно с НТЦ «Информрегистр» и ИМЛИ им. М.Горького РАН при поддержке Роскоминформа. Для этого проекта была создана универсальная технология «Аргонавт», которая включала как средства разметки и отображения текстов, так и средства навигации, а так же различные поиски — и текстовые, и атрибутные. На основе этой технологии вышло 3 издания – справочник стандартов «Информ – Норматив», электронное научное издание «А.С. Грибоедов» и «Пушкин. Электронный фонд русской классической литературы». Также был создан словарь языка Грибоедова.

В начале 1996 года был разработан алгоритм построения гипотез. Отныне морфологический разбор перестал быть привязан к словарю — если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова и по ним строится модель словоизменения.

В это время Интернет в России только начинался...


Новая история (до Yandex.Ru)
Летом 1996 года руководство CompTek и разработчики поисковой системы пришли к выводу, что развитие самой технологии важнее и интереснее, чем создание прикладных продуктов на базе поиска. Исследования рынка показали своевременность и большие перспективы поисковых технологий. Тогда в Интернете и появился «Яndex».

Слово «Яndex» придумал за несколько лет до этого один из основных и старейших разработчиков поискового механизма. «Яndex» означает «Языковой index», или, если по-английски, «Yandex» — «Yet Another indexer». За 4 года публичного существования Яndex возникли и другие толкования. Например, если в слове «Index» перевести с английского первую букву («I» — «Я»), получится «Яndex».

На выставке Netcom'96, 18 октября 1996 года, CompTek анонсировал первые продукты серии Яndex (Яndex.Site, Яndex.Dict). Яndex.Site — поиск по своему сайту — сейчас установлен на сотнях серверов Рунета. Яndex.Dict, морфологическое расширение запроса, используется до сих пор для, например, передачи запроса на AltaVista, хотя сегодня это уже не так актуально — AltaVista индексирует русский Интернет гораздо хуже, чем русские поисковые машины.

Через полгода появился Яndex.CD — поиск документов на CD ROM, а затем Яndex.Lib — полнофункциональная библиотека Яndex для встраивания в различные приложения и базы данных.

Еще через полгода стало очевидно, что ничто не отделяет CompTek от создания собственной глобальной поисковой машины. Объем Рунета составлял тогда всего несколько гигабайт. Осенью 1997 года был открыт Yandex.Ru.

Необходимость поддерживать работу Yandex.Ru в условиях больших объемов (200 Гб текстов) и больших нагрузок (несколько запросов в секунду) ведет к оптимизации алгоритмов, которые потом используются и в других продуктах Яndex.


История Yandex.Ru
Официально поисковая машина Yandex.Ru была анонсирована 23 сентября 1997 года на выставке Softool. Основными отличительными чертами Yandex.Ru на тот момент были проверка уникальности документов (исключение копий в разных кодировках), а также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка (в том числе и поиск по точной словоформе), поиск с учетом расстояния (в том числе в пределах абзаца, точное словосочетание), и тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе.

Чуть позже в разделе «Сказки» (наблюдения за содержанием русского Интернета) появилась первая сказка Рунета — «Web – гуманизм или чернуха?». А в разделе «Числа» — первая оценка объема Рунета, 5 тысяч серверов и 4Гб текстов.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex.Ru можно обращаться просто «по-русски», задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы. Средняя длина запроса в Yandex.Ru сейчас — 2,7 слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были приучены к телеграфному стилю.

В 1998 году на Yandex.Ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За этот год «объем» Русского Интернета удвоился, что привело к необходимости оптимизации поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость поиска на Yandex.Ru — доли секунды.

За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве пользователей. Это был год бурного развития и для Yandex.Ru. Новый поисковый робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня поисковая база Yandex.Ru вдвое больше, чем у ближайших конкурентов.

Новый робот позволил предоставить пользователям новые возможности – поиск по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и изображениям, а также выделять документы на русском языке. Появился поиск в категориях каталога и впервые в Рунете было введено понятие «индекс цитирования» — количество ресурсов, ссылающихся на данный.

В течение всего года продолжалась работа по количественному и качественному анализу Рунета. Был открыт НИНИ-индекс (индекс «Непостоянства Интересов Населения Интернет»), показывающий динамику изменения интересов пользователей Интернета. Открылся поисковый Форум и новый сервис — подписка на запрос, то есть можно оставить свой запрос на Yandex.Ru и регулярно получать по электронной почте информацию о появлении новых и/или измененных документов, соответствующих этому запросу. К началу учебного года был открыт «Семейный Яndex», фильтрация результатов поиска от мата и порнографии.



Добавлено molkon, 11/09/2004
Источник
Прочитано: 17217

Версия для печати  Версия для печати
Другие темыДругие статьи
- Софт - Железо - Общее - Полезности - Безопасность - Интернет - Система -11/09/2004 - История Google
11/09/2004 - История Yandex
07/03/2004 - Э ... коммерция.
05/03/2004 - Как работает Интернет

Ваши комментарии:
21.25/09/2008 @ 06:59:10 - Сок Ол Офф

В посте много чего упрощено, в отличии от реальной жизни... :)
20.23/10/2008 @ 11:47:10 - Николай

Эээ, объясните, плиз, а то я че-то не совсем въехал, это как?
19.19/11/2008 @ 18:27:59 - Егор

Занятно! По-настоящему супер написано. :)
18.27/12/2008 @ 04:03:20 - Петр

Текст на самом деле понравился, особенно последний абзац хорош :)
17.28/12/2008 @ 05:34:28 - Рустам

Немного не в тему, но вопрос такой возник автору. А почему вы именно вордпресс выбрали для своего блога. Я вот ваш блог постоянно читаю :)
16.02/01/2009 @ 07:44:21 - Тимур

Любое искусство, особенно не совсем традиционное, всегда вызывало ожесточенные споры. Думаю, оно просто имеет право на свое существование, вот и всё!
15.29/01/2009 @ 01:44:26 - Николай

Я, хоть и не постоянный читатель, но всё же скажу свое мнение. На ваш блог попал совсем случайно. Однако нашел много чего нового и интересного. Так что, как говорится, АФФТАР ПЕШИ ИСЧО! :)
14.04/02/2009 @ 11:55:13 - Афанасий

Занятно. Некоторые моменты не знал.
13.06/02/2009 @ 09:23:36 - Эрик

Где-то я уже что-то аналогичное читал, причём практически один в один... :)
12.09/02/2009 @ 05:48:10 - Наум

Даа... После прочтения даже мне эта тема стала интересна.
11.28/02/2009 @ 21:10:49 - XУЛИГAH

Хм... После прочтения даже мне эта тема стала интересна.
10.28/03/2009 @ 22:59:20 - кoшмap

Вопросик вот такой возник, а кто может объяснить девушке как добавить этот блог в избранное?
9.07/04/2009 @ 14:53:32 - Руслан

Прикольно написано, но мне кажется, что все-таки автор что-то не договаривает :)
8.02/06/2009 @ 17:21:55 - CBИTOШA

Скажите, а у вас есть RSS поток в этом блоге?
7.05/06/2009 @ 13:54:53 - Иван

Да уж, это конечно же нелегко. :)
6.22/08/2009 @ 20:00:52 - БaкинcкийPoмaн

{Читаю {ваш|этот|} блог, и понимаю, что {ничего|нифига} не понимаю. Все так запутано. :)
5.13/12/2009 @ 10:06:20 - CЛAДEHЬKИЙ

Да, интернет - огромен, если и такое даже можно откопать ;)
4.18/12/2009 @ 20:03:57 - Филипп

Пока успел прочитать только эту одну статью, если и все остальное точно также интересно, то автору респект :)
3.25/12/2009 @ 23:31:45 - пятницa

Даа... Мне кажется, минусы намного превосходят плюсы. Думаю, не стоит заморачиваться.
2.19/03/2010 @ 01:32:49 - BYMNARBILLA

А как это перефразировать?
1.19/03/2010 @ 06:30:21 - wefsCeque

Весьма ценное сообщение


(c) 2011