?

Log in

No account? Create an account
entries friends calendar profile My Website Previous Previous Next Next
Скучно, братцы - Уголок Школьника
scolar
scolar
Скучно, братцы
Первый раз про расстояние редактирования я прочитал, когда мы в маленькой биоинформатической компании подумывали, как бы сравнивать похожесть двух химических формул. Затем я про него читал, когда в маленькой аутсорсинговой компании мы думали о том, как сравнивать два потока биржевых котировок. Теперь я про него читаю, размышляя над тем, как сравнивать доменное имя с именем гипотетической компании-владельца.
10 comments or Leave a comment
Comments
kotya From: kotya Date: August 8th, 2005 03:38 pm (UTC) (Link)
А где ты про это читаешь? Интересно.
scolar From: scolar Date: August 8th, 2005 03:48 pm (UTC) (Link)
Набираешь в гугле String alignment и наслаждаешься. Да ты ж, небось, всех этих Needleman-Wunsch и прочих Smith-Waterman знаешь - они ж для вас старались.
max_ushakov From: max_ushakov Date: August 8th, 2005 05:11 pm (UTC) (Link)
Ага, только в каждой науке для этого есть, кажется, свои фамилии... :-)
kotya From: kotya Date: August 8th, 2005 10:01 pm (UTC) (Link)
Я, честно говоря, никогда не слышала словосочетания "расстояние редактирования", поэтому удивилась, что за наука такая. А про string alignment и Smith-Waterman знаю, конечно. Впрочем, Needleman-Wunsch - тоже не знаю.

Ладно, понаслаждаюсь еще, чувствую. А может ты, как специалист, посоветуешь книжку типа "SQL для чайников", а? А то столько всякого продают...
rshura From: rshura Date: August 8th, 2005 07:02 pm (UTC) (Link)
Доменное имя с именем гипотетической компании-владельца сравнивают так:
$ whois domainname
и смотрят на вывод, до тех пор, пока результат сравнения не станет очевиден :-)
From: ex_sansanch557 Date: August 9th, 2005 06:36 am (UTC) (Link)
далеко не все так просто! :)
scolar From: scolar Date: August 9th, 2005 11:17 am (UTC) (Link)
Тут есть проблемы:
1. Whois-сервера не любят массированных запросов
2. Некоторые сайты регистрируются на частное лицо
3. Некоторые сайты регистрируются на компанию-хостера

Ну и т.д.
rshura From: rshura Date: August 9th, 2005 01:28 pm (UTC) (Link)
Ага, то есть задача, на самом деле, такая: как сравнивать доменное имя с именем гипотетической компании-владельца, со скоростью 100 имён в секунду? Со второй проблемой можно возится долго, напр. гуглить частное лицо до тех пор, пока что-то не всплывёт. С третьей --- вообще вилы. Не совсем понятно, всё же, как помогут навороченные методы.
boooms From: boooms Date: August 9th, 2005 12:15 pm (UTC) (Link)
Да, я тогда обратил внимание, что эту задачу можно столькими способами переформулировать, что ей можно найти место чуть ли не в любой теории.
10 comments or Leave a comment