Page 40 of 79

Posted: Sun Dec 14, 2008 1:16 pm
by Moridin
*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...

Posted: Sun Dec 14, 2008 1:21 pm
by dellusion
Добре, защо им трябюаше на тия малоумници да разюалят бгмапс-а. Сега е неизползюаем.

Posted: Sun Dec 14, 2008 1:30 pm
by Moridin
Да, много са го омотали :(

и преди ме дразнеше, че не е като гугълмапс (а картите са му доста по-добри от ГМ), но сега предпочитам стария вариант, след като не могат да го направят като хората..

Posted: Sun Dec 14, 2008 9:21 pm
by Interpreter
Moridin wrote:*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...
И на мен.

while sum >= beer
:beer:
sum = sum - beer
endwhile
;p

Posted: Mon Dec 15, 2008 1:24 am
by Roamer
...или, както вече неведнъж споменавам, използване на вече готови продукти - в случая и речници. Някои дори ги има в компютърен вариант, някои дори са под достатъчно свободни, но неограничаващи в свободата си, лицензи, че да могат да бъдат ползвани и за свободни, и за комерсиални цели.

Но както и да е де, Драгън всъщност вече май си е намерил друго, подходящо за неговия конкретен случай, решение, та така :)

Posted: Mon Dec 15, 2008 2:52 am
by Moridin
Пешо, визирах и начина, по който са направени готовите продукти ;р

кой се интересува от практични решения за конкретни случаи ениуей? :mrgreen: като се постави такава голямка задача, въпросът е принципен

Posted: Mon Dec 15, 2008 10:52 am
by Roamer
Ми първата стъпка в принципното решение е направено вече - *веднъж* - и всички сме благодарни на хората, които са си направили труда да направят голямото въвеждане :) Оттам нататък нужда от голямо въвеждане не би трябвало да има *нито веднъж* - затова изскимтях срещу твоята гледна точка, *дори* за принципното решение... просто защото от един момент нататък дори принципното решение *не* включва голямо въвеждане :)

Posted: Mon Dec 15, 2008 11:17 am
by Moridin
Разбира се, че включва. _Принципна_ ситуация означава начисто, с неизвестен досега език и с дадени правила, без никаква подготовка. Това че конкретно за българския конкретно се намерило кой конкретно какво да въведе, е много далеч от "принципно" :)

Posted: Mon Dec 15, 2008 11:24 am
by The Dragon
Жоре тая задача е невъзможна. Очевидно е че не можеш да имаш тюрингова машина която да може да обработва език.

Posted: Mon Dec 15, 2008 11:34 am
by Roamer
Драгън, Жоро не говори за тюрингова машина, а за решение от нулата за конкретен език с неговите си правила - каквато би била ситуацията и с българския преди десетина години.

Жоро, "лошото" е, че в последните пет-десет години почти не останаха популярни езици, за които някой да не си е направил труда да направи вече речниците, така че ситуацията, която ти обсъждаш, вече е почти прекалено теоретична :)

Posted: Mon Dec 15, 2008 11:42 am
by Moridin
Ама само тя е интересната, иначе е ясно, че с готова система за словообразуване и разпознаване на словоформи, останалото е тривиално ;р

Posted: Mon Dec 15, 2008 11:42 am
by The Dragon
Да ама точно проблема на езика. Правилата му не са правила а по скоро напътствия. Затова не можеш да направиш програма която при крайна големина на зададения текст да може да се обучи да го "разбира".

Posted: Mon Dec 15, 2008 11:44 am
by Moridin
Тук никой не говори за разбиране на език (което според мен също не е невъзможна задача, а и не забравяй, че включваме и евристични методи, а не само детерминистични, поради естеството на задачата, така че да оставим машините на Тюринг за момента), а единствено за разпознаване на корена на словоформи, което е доста по-ограничена и напълно реална (а както виждаме вече и изпълнена задача).

Та точно за НЕЯ задача ми беше думата, че принципно не е особено трудна и е главно въпрос на ужасно много въвеждане на данни и оптимизационни хитринки, нежели на някаква космическа алгоритмика.

Posted: Mon Dec 15, 2008 1:37 pm
by Corwin
Съгласен съм с лицето Георги Пенчев - в смисъл, че и аз не разбирам за какъв алгоритъм може да става дума в нещо подобно.
Така става при неорганизираните проточващи се оупън сорс проекти - с вековете всеки комитва и налага по нещо и накрая става невъобразим хаос - при лингвистичните, а и при еволюцията, изключенията са далеч повече от правилата - всякакъв опит за алгоритмизиране би бил напълно безмислен - много въвеждане и малко оптимизации биха свършили доста по-добра работа.
А иначе другото лице Пенчев май просто иска да обясни, че не е необходимо да се мъчим да откриваме колелото, след като други са го открили. Това си е съвсем друга тема, с която не съм много съгласен, защото първо, откриването може да бъде доста забавно, и второ де да знаеш - квадратното колело дето ти си го измислиш може да се окаже доста по-ефективно... :)

Posted: Mon Dec 15, 2008 1:49 pm
by Roamer
Ми това може би си е въпрос на лично мнение, но за последните петнайсетина години програмистване някак си съм се убедил, че на мен лично ми е много по-лесно да прекарам час-два в преглеждане и audit-ване на готов чужд код и след това просто да си го вкарам в продукта, отколкото да прекарам няколко дни в четене и осмисляне, после още няколко дни в писане и накрая няколко месеца в чудене дали пък все пак не съм пропуснал нещо - до момента, в който някой клиент се сблъска с нещото, което съм пропуснал, и се окаже, че ще е по-добре да пренапиша една трета от кода си :)

И, да, съгласен съм, че точно в този случай, и точно за българския език, алгоритмите за подушване на дума, осмисляне що за част на речта е тя, а после сдъвкване и изплюване на основната й форма, не са кой знае колко трудни, а и че за правене на речник си има добре оптимизирани с времето алгоритми (и, да, "оптимизационните хитринки" аз лично ги включвам в графата "алгоритми" :)) - и все пак това са неща, които, при достатъчно друга работа за вършене, в повечето случаи аз лично бих предпочел да си спестя :)