Майкрасофт НМТ перакладчык Microsoft Бінг нейронный машынны пераклад поўная

Майкрасофт НМТ перакладчык Microsoft Бінг нейронный машынны пераклад поўная
Нейронный машынны пераклад (НМТ) Гэта выкарыстанне інтэлекту, высокай якасці машыннага перакладу на новы стандарт。 Ён замяніў стары стыль статыстычны машынны пераклад (СМТ) Тэхналогія,Тэхналогіі ў 2010-2020 Сярэдніх гадоў, дасягнуў піка якасці 。
Па параўнанні з СМТ,НМТ можа не толькі ад зыходнага якасці перакладу балаў становішчы, каб забяспечыць лепшае перакладу,І гучыць больш гладка、Больш падобныя на людзей。 Гэтая бегласць галоўная прычына заключаецца ў тым, што НМТ выкарыстоўвае фразу з поўнага кантэксту перавесці слова。 СМТ проста разгледзець кожнае з слоў у вачах і за некалькі слоў у прамым кантэксце。
Мадэль НМТ з'яўляецца API ядра,Нябачныя для канчатковага карыстальніка。 Адзіным відавочным адрозненнем з'яўляецца паляпшэнне якасці перакладу ,Асабліва для кітайцаў、Японскі і арабскі і іншыя мовы。
Што такое машынны пераклад?
Сістэмы машыннага перакладу з'яўляецца выкарыстанне тэхналогіі машыннага навучання будзе вялікі аб'ём тэксту з любога з падтрымоўваных моў пры перакладзе з прыкладання або анлайн-сэрвісы。Служба будзе"крыніца"тэкст перакладаецца з адной мовы на іншы"мэтавай"мова。
Хоць тэхналогіі машыннага перакладу за канцэпцыю і выкарыстоўваць яе інтэрфейс з'яўляецца адносна простым,Але навука і тэхналогія надзвычай складаная,І вядучыя сусветныя тэхналогіі сумесна,Асабліва глыбокае вывучэнне(штучны інтэлект),Вялікія дадзеныя,Мова,Хмарныя вылічэнні і вэб-API。
З 2010 года з пачатку,Новая тэхналогія штучнага інтэлекту,То ёсць глыбіня нейронавай сеткі, таксама вядомы як глыбокае вывучэнне),Каб зрабіць тэхналогію распазнання прамовы дасягнула ўзроўню якасці,Так што каманда Microsoft перакладчык, распазнання прамовы і іншых асноўных тэкст перакладу тэхналогія ў спалучэнні з,Каб Запусціць Тэхналогію Распазнання Прамовы 。Новая тэхналогія галасавога перакладу 。
Гісторыя,У прамысловасці выкарыстоўваюць асноўных метадаў машыннага навучання-гэта статыстычны машынны пераклад(СМТ)。Некалькі слоў аб кантэксце справы,СМТ выкарыстоўвае перадавыя статыстычны аналіз, каб ацаніць словы лепшага эфекту перакладу 。З сярэдзіны 2000-х пачалі,У тым ліку Microsoft, у тым ліку ўсе найбуйнейшыя бюро перакладаў выкарыстоўваюць СМТ。
З'яўляецца нейронный машынны пераклад(НМТ)выклікаць пераклад мастацтва фундаментальнае змяненне,Каб павысіць якасць перакладу。Гэтая тэхналогія пераклад быў у другой палове 2016 пачнецца для карыстальнікаў і распрацоўшчыкаў, каб разгарнуць 。
SMT і прыёмы перакладу НМТ дзве рэчы:
  • Абодва патрабуюць шмат дочеловеческой пераклад кантэнту мільёны перакладу прапаноў у сістэме навучання 。
  • Абодва не дзейнічае як двухмоўны слоўнік,Але згодна пералік магчымых перакладу слова,Але паводле прысуду, выкарыстоўваючы слова кантэкст перакладу。
Што такое Microsoft перакладчык для?
Як API частка калекцыі,Microsoft перакладчык ў тэкст API і сэрвісаў Microsoft маўленчага службы машыннага перакладу ад Microsoft 。
Microsoft перакладчык перавесці тэкст
З 2007 года,Каманда Microsoft была ў выкарыстанні Microsoft перакладчык тэкставага API,З 2011 года,Ён быў выкарыстаны ў якасці кліенцкіх API, каб выкарыстоўваць。MicrosoftTranslator тэкст API Microsoft ўнутраную ён шырока выкарыстоўваецца。Яна інтэграваная ў лакалізацыі прадукту ,Падтрымаць каманду онлайн-камунікацый 。Таксама можа быць з знаёмых прадуктаў。
Microsoft перакладчык можа быць у любы апаратнай платформе на сайце або ў кліенцкім дадатку, а таксама з любой аперацыйнай сістэмай, для выкарыстання з,Для выканання перакладу і іншых лінгвістычных аперацый,Напрыклад, распазнаванне мовы ,Тэкст-у-гаворка ці слоўнік。
Выкарыстанне стандартнай тэхналогіі адпачынку ,Распрацоўнікам будзе прадастаўлены з указаннем мэтавага мовы параметраў тэксту арыгінала або перакладу прамовы з аўдыё-адпраўляюць у сэрвіс,Затым служба будзе перакладзены тэкст адпраўляецца назад на кліент або вэб-дадатак для выкарыстання。
Служба Microsoft перакладчык размяшчаецца ў Цэнтры апрацоўкі дадзеных Microsoft у службе Azure,І з іншых хмарных службаў Microsoft таксама атрымліваеце бяспеку,Маштабаванасць,Надзейнасць і бесперапынную даступнасць дапамогі。
Microsoft перакладчык голас перавесці
Тэхналогія Microsoft перакладчык галасавой пераклад ад перакладчыка па Skype пачнецца ў канцы 2014 запуск ,З пачатку 2016 года запусціць у якасці адкрытага API для выкарыстання кліентам 。Ён быў інтэграваны ў Microsoft перакладчык ў рэальным часе функцыя,Скайп,Трансляцыя сходаў Skype для Android і Microsoft перакладчык прыкладанне,iOS і Windows。
Пераклад прамовы ў размова Майкрасофт зрабіць,Майкрасофт голас-гэта цалкам наладжвальны скразное абслугоўванне,Для распазнання прамовы ,Галасавыя перакладчык і ГЦ(тэксту ў размова)。
Пераклад тэксту, як працаваць?
Для перакладу тэкст у асноўным тэхнічны, ёсць два:Традыцыйныя метады,Статыстычны машынны пераклад(СМТ)і тэхналогій наступнага пакалення,Што нейронный машынны пераклад(НМТ)。
Статыстычны машынны пераклад
Microsoft перакладчык для дасягнення статыстычнага машыннага перакладу(СМТ)пабудаваць у Microsoft на працягу больш чым дзесяцігоддзі даследаванняў натуральнага мовы, на аснове。Сучасны пераклад сістэмы замест таго, каб пісаць інструкцыю правілы паміж мовамі перакладу,Але пераклад будзе лічыцца з існуючых перакладаў чалавечым мовай навучання паміж тэкстам пераўтварэнне і выкарыстанне праграмы статыстычнай і машыннага навучання апошніх дасягненняў у задачы。
Так званы"паралельны корпус"шмат у чым служыць сучасная Розеттский камень,У кантэксце многіх моўных пар і тэматык, каб даць слова,Фраз і ідыём перакладу。Статыстычныя метады мадэлявання і эфектыўных алгарытмаў, якія могуць дапамагчы кампутары, каб вырашыць расшыфраваць вызначэнне навучальных дадзеных у зыходным мове і мове перакладу паміж адпаведнымі адносінамі прымірэнне код, каб знайсці новыя ўваходныя прапановы, лепшы пераклад пытанні。Перакладчык статыстычных метадаў Microsoft з лінгвістычнай інфармацыі,Для таго, каб вырабіць лепшае абагульненне і прыводзіць да больш лёгка зразумець пераклад мадэль。
Паколькі гэты метад не спадзявацца на слоўнік ці правілы граматыкі,Таму ён дае фраза лепшы пераклад,У дадзенае слова выкарыстоўваць ўсяго кантэксту, а не старацца выканаць адно слова перакладу。Для перакладу слова,Распрацаваны двухмоўны слоўнік。
Нейронный машынны пераклад
Пастаяннае ўдасканаленне перакладу вельмі важна。Але,З 2010 года пачынаючы з сярэдзіны,SMT тэхналогія, павышэнне прадукцыйнасці было ў стабільным стане。Дзякуючы выкарыстанню Майкрасофт Ай супер кампутар, у асаблівасці Microsoft кагнітыўны інструментар шкалы і функцыі,Перакладчык Microsoft цяпер дае на аснове нейронавай сеткі(пераклад ЛСТМ ,Так што якасць перакладу палепшылася на новае дзесяцігоддзе。
Гэтыя нейросетевая мадэляў даступныя праз словы Microsoft і выкарыстоўваць ID катэгорыі тэксту, API для ўсіх галасавых мова。
З традыцыйным СМТ па параўнанні,Нейронавая сетка для пераўтварэння спосабу выканання прынцыпова розных。
Наступная анімацыя паказвае нейронных сетку пераклад на пераклад вопыту кожнага кроку。З дапамогай гэтага метаду,Пераклад будзе паставіць ўсе прапанову ў кантэксце,Замест методыкі СМТ, выкарыстоўваючы толькі некалькі слоў споўзаючы вокны,І будзе вырабляць больш свабодна і чалавечага перакладу。
На аснове навучання нейронавай сеткі ,Усе словы ўздоўж 500-мерны вектар кадоўкі,Вектарная ўяўленне канкрэтнай пары моў, такіх як англійская і кітайскі, і яго унікальныя асаблівасці。У залежнасці ад мовы навучання,Нейронавая сетка будзе наладжваць гэтыя памеры павінны быць。Яны могуць быць кадавання некаторых простых паняццяў,Напрыклад, пол жаночы,Мужчыны,Нейтральны),Ступень ветлівасці мовы з ,Не саромейцеся,Напісана,Форма і г. д.,Калі ласка, увядзіце слова: дзеяслоў,Назоўнік і г. д.,А таксама любыя іншыя невідавочныя асаблівасці з навучальных дадзеных, атрыманых。
Нейронавая сетка пераклад вопыту выканайце наступныя дзеянні:
  • Кожнае слова,Ці, дакладней, выказаў сваё 500-мерны вектар,Усё праз"нейронаў"першага пласта,Ён будзе ў сказе іншымі словамі кантэксце слова 1000-мерны вектар B ў яго кадаваньне。
  • Пасля таго, як усе словы як-то закадаванае ў гэтых 1000-мерны вектар у,Гэты працэс будзе паўтарацца некалькі разоў,Кожны пласт можа быць закончаны прапанову, у кантэксце больш тонкай налады словы ў 1000-мерным прадстаўленні з тэхналогіяй SMT, наадварот, можа разглядаць толькі 3 да 5 вокны Word
  • Тады,Звярніце ўвагу, што пласт, г. зн. алгарытм праграмнага забеспячэння будзе выкарыстоўваць канчатковы вывад матрыцы,Пласт увазе будзе выкарыстоўваць гэты апошні выхадны матрыцы і раней перакладзеныя выходную слова для вызначэння наступнага варта перавесці зыходны сказ, у якім слова。Яго таксама будуць выкарыстоўваць гэтыя разлікі ў патэнцыйна адкінуць мовы непатрэбных слоў。
  • Пераклад пласт дэкодэр ў найбольш падыходных мэтавай мову эквівалентны мове пераклад абранага словы, або, больш канкрэтна,У поўны кантэкст фразы паказвае на тое, што словы 1000-мерны вектар。І затым апошні пласт зваротнай сувяззю па выхаду для адпаведнага пласта,Для таго, каб разлічыць адпаведны пераклад зыходнага прапановы, у якой наступнае слова。

У анімацыі паказана ў Прыкладзе,Кантэкстна-залежныя 1000-мерныя мадэлі" "будзе закадаваны як назоўнік дом-гэта французскі дом у жанчын словы。Гэта дазволіць для правільнага перакладу", "будзе" цягнуць", а не" музыка "стаіць у адзіным ліку,Мужчына, або" лес "ў множным ліку пасля дасягнення ўзроўню пераўтварэнні дэшыфратара 。
Звярніце ўвагу, што алгарытм будзе грунтавацца на раней перакладзеныя словы ў дадзеным выпадку" да "вылічылі,Побач з перакладам слова павінна быць тэма" дом "замест прыметніка" сіні ") 。Прычына гэтая мэта можа быць дасягнута,Таму што сістэма разумее англійская і французская мовы стануць дагары нагамі гэтыя словы ў прапановы для таго。Вы таксама можаце разлічыць,Калі прыметнік" вялікі", а не колер,Яна не павінна адмяняць іх" вялікі дом " =>"ля Гранд Мэзон", а。
Дзякуючы выкарыстанню гэтага метаду,У большасці выпадкаў,Выніковы каэфіцыент выхаду СМТ-пераклад больш гладкай,Бліжэй да чалавечага перакладу。
Галасавой пераклад, як працаваць?
Microsoft перакладчык можа перакладаць голас。Тэхналогіі ў перакладчыка ў рэжыме рэальнага часу функцыя,Дадатак перакладчык ,Перакладчык у Skype раскрытая,І першапачаткова толькі праз функцыю перакладчыка ў Skype, а таксама на iOS і Android на Microsoft перакладчык дадатак забяспечвае гэтую функцыянальнасць。Зараз распрацоўшчыкі могуць выкарыстоўваць партал Azure прадастаўляе апошняя версія астатнія на аснове адкрытых API для развіцця。
Хоць на першы погляд з папярэдняга ўзроўню тэхнікі на аснове пабудовы тэхналогіі перакладу прамовы, быццам бы просты працэс,Але гэта павінна быць зроблена, чым існуючыя"традыцыйныя"чалавек-машына распазнання прамовы проста ўстаўляецца ў існуючы тэкст у значна больш。Пераклад。
Для таго, каб быць"крыніцай"галасы з аднаго мовы правільна перавесці на іншы"мэтавай"мова,Сістэмы трэба прайсці праз чатыры кроку。
  • Распазнанне прамовы ,Канвертаваць аўдыё ў тэкст
  • TrueText:Тэхналогія Microsoft ,Можа для нармалізацыі тэксту, каб зрабіць яго больш прыдатным для перакладу
  • Тэкст машыннага перакладу для перакладу,Але выкарыстанне спецыяльна распрацаваных для рэальных гутарковых дыялогаў, развіцця перакладчыцкай мадэлі
  • Пры неабходнасці, пераўтварэнне тэксту ў размова пераўтварэнні,Для стварэння аўдыё перакладу。

Аўтаматычнае распазнаванне прамовы, аўтаматычнае распазнаванне прамовы)
З дапамогай навучанай нейронавай сеткі сістэмы(НН)для выканання аўтаматычнага распазнавання прамовы АСР),Сістэма можа аналізаваць тысячы гадзін аўдыё голас。Мадэль заснавана на ўзаемадзеянні паміж людзьмі, а не людзі з машынай каманды для трэніроўкі,Такім чынам, для рэгулярнага дыялогу, аптымізаваныя для распазнання прамовы。Для дасягнення гэтай мэты,З традыцыйным "чалавек-машына" АСР па параўнанні,Трэба больш дадзеных і больш ДНН。
TrueText
Калі людзі з іншымі людзьмі пры зносінах,Нашы словы не так, як мы звычайна думаем як ідэальны,Выразныя і акуратныя。З дапамогай тэхналогіі TrueText ,Ухіляючы голас розніца ў запаўненні слова, напрыклад," розум","ах","а","як",заікаецца і паўтарае。Шляхам дадання перыяду,Пунктуацыю і загалоўныя літары,Вы таксама можаце палепшыць чытальнасць тэксту і пераклад。Для таго, каб атрымаць гэтыя вынікі,Выкарыстоўваючы дзесяцігоддзяў моўных тэхналогій працы,Гэта з развітых перакладчыка,Выкарыстоўваецца для стварэння TrueText。На наступным малюнку праз рэальны прыклад, каб апісаць TrueText на розныя пераўтварэнні ў галіне стандартызацыі дадзенага тэксту。

Пакінуць каментар