ShadowDance

Posted: **Sun Dec 14, 2008 1:16 pm**

*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...

Posted: **Sun Dec 14, 2008 1:21 pm**

Добре, защо им трябюаше на тия малоумници да разюалят бгмапс-а. Сега е неизползюаем.

Posted: **Sun Dec 14, 2008 1:30 pm**

Да, много са го омотали

и преди ме дразнеше, че не е като гугълмапс (а картите са му доста по-добри от ГМ), но сега предпочитам стария вариант, след като не могат да го направят като хората..

Posted: **Sun Dec 14, 2008 9:21 pm**

Moridin wrote:*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...

И на мен.

while sum >= beer

sum = sum - beer
endwhile
;p

Posted: **Mon Dec 15, 2008 1:24 am**

...или, както вече неведнъж споменавам, използване на вече готови продукти - в случая и речници. Някои дори ги има в компютърен вариант, някои дори са под достатъчно свободни, но неограничаващи в свободата си, лицензи, че да могат да бъдат ползвани и за свободни, и за комерсиални цели.

Но както и да е де, Драгън всъщност вече май си е намерил друго, подходящо за неговия конкретен случай, решение, та така

Posted: **Mon Dec 15, 2008 2:52 am**

Пешо, визирах и начина, по който са направени готовите продукти ;р

кой се интересува от практични решения за конкретни случаи ениуей?

като се постави такава голямка задача, въпросът е принципен

Posted: **Mon Dec 15, 2008 10:52 am**

Ми първата стъпка в принципното решение е направено вече - *веднъж* - и всички сме благодарни на хората, които са си направили труда да направят голямото въвеждане

Оттам нататък нужда от голямо въвеждане не би трябвало да има *нито веднъж* - затова изскимтях срещу твоята гледна точка, *дори* за принципното решение... просто защото от един момент нататък дори принципното решение *не* включва голямо въвеждане

Posted: **Mon Dec 15, 2008 11:17 am**

Разбира се, че включва. _Принципна_ ситуация означава начисто, с неизвестен досега език и с дадени правила, без никаква подготовка. Това че конкретно за българския конкретно се намерило кой конкретно какво да въведе, е много далеч от "принципно"

Posted: **Mon Dec 15, 2008 11:24 am**

Жоре тая задача е невъзможна. Очевидно е че не можеш да имаш тюрингова машина която да може да обработва език.

Posted: **Mon Dec 15, 2008 11:34 am**

Драгън, Жоро не говори за тюрингова машина, а за решение от нулата за конкретен език с неговите си правила - каквато би била ситуацията и с българския преди десетина години.

Жоро, "лошото" е, че в последните пет-десет години почти не останаха популярни езици, за които някой да не си е направил труда да направи вече речниците, така че ситуацията, която ти обсъждаш, вече е почти прекалено теоретична

Posted: **Mon Dec 15, 2008 11:42 am**

Ама само тя е интересната, иначе е ясно, че с готова система за словообразуване и разпознаване на словоформи, останалото е тривиално ;р

Posted: **Mon Dec 15, 2008 11:42 am**

Да ама точно проблема на езика. Правилата му не са правила а по скоро напътствия. Затова не можеш да направиш програма която при крайна големина на зададения текст да може да се обучи да го "разбира".

Posted: **Mon Dec 15, 2008 11:44 am**

Тук никой не говори за разбиране на език (което според мен също не е невъзможна задача, а и не забравяй, че включваме и евристични методи, а не само детерминистични, поради естеството на задачата, така че да оставим машините на Тюринг за момента), а единствено за разпознаване на корена на словоформи, което е доста по-ограничена и напълно реална (а както виждаме вече и изпълнена задача).

Та точно за НЕЯ задача ми беше думата, че принципно не е особено трудна и е главно въпрос на ужасно много въвеждане на данни и оптимизационни хитринки, нежели на някаква космическа алгоритмика.

Posted: **Mon Dec 15, 2008 1:37 pm**

Съгласен съм с лицето Георги Пенчев - в смисъл, че и аз не разбирам за какъв алгоритъм може да става дума в нещо подобно.
Така става при неорганизираните проточващи се оупън сорс проекти - с вековете всеки комитва и налага по нещо и накрая става невъобразим хаос - при лингвистичните, а и при еволюцията, изключенията са далеч повече от правилата - всякакъв опит за алгоритмизиране би бил напълно безмислен - много въвеждане и малко оптимизации биха свършили доста по-добра работа.
А иначе другото лице Пенчев май просто иска да обясни, че не е необходимо да се мъчим да откриваме колелото, след като други са го открили. Това си е съвсем друга тема, с която не съм много съгласен, защото първо, откриването може да бъде доста забавно, и второ де да знаеш - квадратното колело дето ти си го измислиш може да се окаже доста по-ефективно...

Posted: **Mon Dec 15, 2008 1:49 pm**

Ми това може би си е въпрос на лично мнение, но за последните петнайсетина години програмистване някак си съм се убедил, че на мен лично ми е много по-лесно да прекарам час-два в преглеждане и audit-ване на готов чужд код и след това просто да си го вкарам в продукта, отколкото да прекарам няколко дни в четене и осмисляне, после още няколко дни в писане и накрая няколко месеца в чудене дали пък все пак не съм пропуснал нещо - до момента, в който някой клиент се сблъска с нещото, което съм пропуснал, и се окаже, че ще е по-добре да пренапиша една трета от кода си

И, да, съгласен съм, че точно в този случай, и точно за българския език, алгоритмите за подушване на дума, осмисляне що за част на речта е тя, а после сдъвкване и изплюване на основната й форма, не са кой знае колко трудни, а и че за правене на речник си има добре оптимизирани с времето алгоритми (и, да, "оптимизационните хитринки" аз лично ги включвам в графата "алгоритми"

) - и все пак това са неща, които, при достатъчно друга работа за вършене, в повечето случаи аз лично бих предпочел да си спестя

ShadowDance

Кът на програмиста...