Кът на програмиста...

За коментари и излияния от всякакъв род, число, спрежение и залог

Moderator: Moridin

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Sun Dec 14, 2008 1:16 pm

*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...
This is it. Ground zero.

User avatar
dellusion
Warmage
Posts: 1248
Joined: Thu Dec 28, 2006 10:36 am
Location: София

Post by dellusion » Sun Dec 14, 2008 1:21 pm

Добре, защо им трябюаше на тия малоумници да разюалят бгмапс-а. Сега е неизползюаем.
Look at the darkness...
...around me.

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Sun Dec 14, 2008 1:30 pm

Да, много са го омотали :(

и преди ме дразнеше, че не е като гугълмапс (а картите са му доста по-добри от ГМ), но сега предпочитам стария вариант, след като не могат да го направят като хората..
This is it. Ground zero.

User avatar
Interpreter
Forsaken
Posts: 3462
Joined: Sun Aug 07, 2005 5:57 pm
Location: тук - там

Post by Interpreter » Sun Dec 14, 2008 9:21 pm

Moridin wrote:*bow*

бтв проблемът ми изглежда много повече въпрос на МНОГО работа по въвеждане, отколкото на неяснота как ще стане разпознаването...
И на мен.

while sum >= beer
:beer:
sum = sum - beer
endwhile
;p
"Не вярвам в колективната мъдрост на индивидуалното невежество."
- Йежи Лец, "Невчесани мисли"

User avatar
Roamer
Ascendent
Posts: 4895
Joined: Wed Jan 03, 2007 5:25 pm
Location: Hier ist hier und jetzt ist jetzt doch jetzt ist jetzt schon nicht mehr da...
Contact:

Post by Roamer » Mon Dec 15, 2008 1:24 am

...или, както вече неведнъж споменавам, използване на вече готови продукти - в случая и речници. Някои дори ги има в компютърен вариант, някои дори са под достатъчно свободни, но неограничаващи в свободата си, лицензи, че да могат да бъдат ползвани и за свободни, и за комерсиални цели.

Но както и да е де, Драгън всъщност вече май си е намерил друго, подходящо за неговия конкретен случай, решение, та така :)
Eric: I use my sword to detect good on it.
Ed: It's not good, Eric. It's a gazebo.

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Mon Dec 15, 2008 2:52 am

Пешо, визирах и начина, по който са направени готовите продукти ;р

кой се интересува от практични решения за конкретни случаи ениуей? :mrgreen: като се постави такава голямка задача, въпросът е принципен
This is it. Ground zero.

User avatar
Roamer
Ascendent
Posts: 4895
Joined: Wed Jan 03, 2007 5:25 pm
Location: Hier ist hier und jetzt ist jetzt doch jetzt ist jetzt schon nicht mehr da...
Contact:

Post by Roamer » Mon Dec 15, 2008 10:52 am

Ми първата стъпка в принципното решение е направено вече - *веднъж* - и всички сме благодарни на хората, които са си направили труда да направят голямото въвеждане :) Оттам нататък нужда от голямо въвеждане не би трябвало да има *нито веднъж* - затова изскимтях срещу твоята гледна точка, *дори* за принципното решение... просто защото от един момент нататък дори принципното решение *не* включва голямо въвеждане :)
Eric: I use my sword to detect good on it.
Ed: It's not good, Eric. It's a gazebo.

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Mon Dec 15, 2008 11:17 am

Разбира се, че включва. _Принципна_ ситуация означава начисто, с неизвестен досега език и с дадени правила, без никаква подготовка. Това че конкретно за българския конкретно се намерило кой конкретно какво да въведе, е много далеч от "принципно" :)
This is it. Ground zero.

User avatar
The Dragon
Elder God
Posts: 9062
Joined: Wed Jan 14, 2004 9:03 pm

Post by The Dragon » Mon Dec 15, 2008 11:24 am

Жоре тая задача е невъзможна. Очевидно е че не можеш да имаш тюрингова машина която да може да обработва език.
The sinking of the Titanic was a miracle to the lobsters in the ship's kitchen.

User avatar
Roamer
Ascendent
Posts: 4895
Joined: Wed Jan 03, 2007 5:25 pm
Location: Hier ist hier und jetzt ist jetzt doch jetzt ist jetzt schon nicht mehr da...
Contact:

Post by Roamer » Mon Dec 15, 2008 11:34 am

Драгън, Жоро не говори за тюрингова машина, а за решение от нулата за конкретен език с неговите си правила - каквато би била ситуацията и с българския преди десетина години.

Жоро, "лошото" е, че в последните пет-десет години почти не останаха популярни езици, за които някой да не си е направил труда да направи вече речниците, така че ситуацията, която ти обсъждаш, вече е почти прекалено теоретична :)
Eric: I use my sword to detect good on it.
Ed: It's not good, Eric. It's a gazebo.

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Mon Dec 15, 2008 11:42 am

Ама само тя е интересната, иначе е ясно, че с готова система за словообразуване и разпознаване на словоформи, останалото е тривиално ;р
This is it. Ground zero.

User avatar
The Dragon
Elder God
Posts: 9062
Joined: Wed Jan 14, 2004 9:03 pm

Post by The Dragon » Mon Dec 15, 2008 11:42 am

Да ама точно проблема на езика. Правилата му не са правила а по скоро напътствия. Затова не можеш да направиш програма която при крайна големина на зададения текст да може да се обучи да го "разбира".
The sinking of the Titanic was a miracle to the lobsters in the ship's kitchen.

User avatar
Moridin
Global Moderator
Posts: 19290
Joined: Fri Dec 19, 2003 10:21 pm
Location: On the other side
Contact:

Post by Moridin » Mon Dec 15, 2008 11:44 am

Тук никой не говори за разбиране на език (което според мен също не е невъзможна задача, а и не забравяй, че включваме и евристични методи, а не само детерминистични, поради естеството на задачата, така че да оставим машините на Тюринг за момента), а единствено за разпознаване на корена на словоформи, което е доста по-ограничена и напълно реална (а както виждаме вече и изпълнена задача).

Та точно за НЕЯ задача ми беше думата, че принципно не е особено трудна и е главно въпрос на ужасно много въвеждане на данни и оптимизационни хитринки, нежели на някаква космическа алгоритмика.
This is it. Ground zero.

User avatar
Corwin
Archmage
Posts: 2002
Joined: Fri Mar 26, 2004 3:41 pm
Location: Land of Supidity

Post by Corwin » Mon Dec 15, 2008 1:37 pm

Съгласен съм с лицето Георги Пенчев - в смисъл, че и аз не разбирам за какъв алгоритъм може да става дума в нещо подобно.
Така става при неорганизираните проточващи се оупън сорс проекти - с вековете всеки комитва и налага по нещо и накрая става невъобразим хаос - при лингвистичните, а и при еволюцията, изключенията са далеч повече от правилата - всякакъв опит за алгоритмизиране би бил напълно безмислен - много въвеждане и малко оптимизации биха свършили доста по-добра работа.
А иначе другото лице Пенчев май просто иска да обясни, че не е необходимо да се мъчим да откриваме колелото, след като други са го открили. Това си е съвсем друга тема, с която не съм много съгласен, защото първо, откриването може да бъде доста забавно, и второ де да знаеш - квадратното колело дето ти си го измислиш може да се окаже доста по-ефективно... :)
I like rusty spoons....
I like to touch them...
It's almost orgasmic...

User avatar
Roamer
Ascendent
Posts: 4895
Joined: Wed Jan 03, 2007 5:25 pm
Location: Hier ist hier und jetzt ist jetzt doch jetzt ist jetzt schon nicht mehr da...
Contact:

Post by Roamer » Mon Dec 15, 2008 1:49 pm

Ми това може би си е въпрос на лично мнение, но за последните петнайсетина години програмистване някак си съм се убедил, че на мен лично ми е много по-лесно да прекарам час-два в преглеждане и audit-ване на готов чужд код и след това просто да си го вкарам в продукта, отколкото да прекарам няколко дни в четене и осмисляне, после още няколко дни в писане и накрая няколко месеца в чудене дали пък все пак не съм пропуснал нещо - до момента, в който някой клиент се сблъска с нещото, което съм пропуснал, и се окаже, че ще е по-добре да пренапиша една трета от кода си :)

И, да, съгласен съм, че точно в този случай, и точно за българския език, алгоритмите за подушване на дума, осмисляне що за част на речта е тя, а после сдъвкване и изплюване на основната й форма, не са кой знае колко трудни, а и че за правене на речник си има добре оптимизирани с времето алгоритми (и, да, "оптимизационните хитринки" аз лично ги включвам в графата "алгоритми" :)) - и все пак това са неща, които, при достатъчно друга работа за вършене, в повечето случаи аз лично бих предпочел да си спестя :)
Eric: I use my sword to detect good on it.
Ed: It's not good, Eric. It's a gazebo.

Who is online

Users browsing this forum: Bing [Bot] and 36 guests