Изкуствен интелект и основен английски: нов подход към превода

Намирам, че едно от най-големите предизвикателства на нашето време е това на комуникациите. Въпреки това, след като се постигне комуникация между индивидите, следващата стъпка е тази на разбиране. Английският език е преобладаващият език за човешкото взаимодействие в целия свят днес: 55% от интернет съдържанието е на английски, повечето от най-добрите университети, бизнес транзакции, развлечения, както и научни и технологични публикации използват английски. На техническо ниво на телекомуникационните технологии, това е една от най-бързо развиващите се индустрии.

много инструменти за превод са достъпни за превод между езици, но като цяло са с много ниско качество поради сложността на правилното извличане на еквивалентността между думите и фразите на два различни естествени езика. Преводът е труден поради много причини, включително:

  • липсата на съответствия на думите едно към едно между езиците
  • съществуването във всеки език на омоними
  • фактът, че естествените граматики са идиосинкратични

Те не отговарят на точен набор от правила, които биха улеснили директното заместване от дума на дума. Мнозина са към изчислителното „разбиране“ на тези идиосинкразии изкуствен интелект са насочени изследователски усилия, а ограниченият им успех свидетелства за сложността на проблема. Алтернатива е да общувате на език, който е широко разбран и който много хора искат да научат, дори и на основно разговорно ниво, за да взаимодействат и да се забавляват, какъвто е случаят с английския език. Трудността тогава възниква от как да се усвои сложен материал, дори ако е налично само разговорно ниво на знания.

Китайската писменост например притежава повече от 40 000 основно идеографски знаци, но познаването на четири хиляди е достатъчно за повечето цели. Китайската писменост, доколкото е фонетична, също е едносрична, поради много добрата причина, че думите на езика се състоят само от една сричка, с голям брой омофони, което направи важно да има знаци, които да разграничават тези омофони, и така сценарият избягва да бъде чисто фонетичен. Дори и в този случай, ранното опростяване като това, извършено от Джеймс Йен през 1923 г., доведе до подбор от 1200 от традиционните знаци, за да се формира това, което може да се нарече основен китайски, което позволява на неграмотните хора да четат в тази система след четири месеци работа. По-късно усъвършенстване от Юан Чао създаде система от около 2500 от традиционните знаци, които, както се твърди, могат да покрият основно целия език. Японците решават основния езиков проблем, като добавят Хира Гана. Децата се обучават на 1200 от 40 000 символа, които често съдържат китайски корен и наставки.

Друг опит за изработване на опростена версия на език е този на Основен английскикакто е предложено от Чарлз К. Огдън през 1920-те години. Фактът, че е възможно да се каже почти всичко, което обикновено искаме да кажем с 850 думи, прави Basic English нещо изключително привлекателно. Чрез добавянето на 100 думи, необходими за всяка обща област като науката, и 50 международно признати думи, общо 1000 думи позволяват успешна комуникация.

Представете си сега, че вместо да превеждате сложен технически текст на собствения си език, вие сте в състояние да опростите неговия речник, за да можете да разберете думите и следователно същността на съдържанието. Това е друг подход на превод което трябва да се обозначава като преобразуване тъй като речникът се преобразува в подмножество на същия език. Ето как виждам бъдещето на превода: конвертиране на съдържание в a представяне с намален речник на същия език, за да го опростите и да можете да го разберете.

Ясно е, че когато сложен или двусмислен материал се превръща от английски в представяне с намален речник, ще има известна загуба на семантично съдържание. Въпреки това материалите от правен, бизнес, научен и технологичен характер обикновено се произвеждат специално по начин, който се стреми да бъде едновременно точен и ясен и следователно е податлив на представяне с намален речник. В интернет, от друга страна, ако вземем предвид научните и технологичните думи, необходимият речник се доближава до 100 000 думи и следователно е много извън капацитета на средния английски като чуждоезичен студент. Следователно използването на базов английски за (пре)дефиниране на тези думи позволява на хората с основни познания по английски да разберат почти 100 00 думи, знаейки само 1000 от тях.

Empfohlene Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert