От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций
项目来源
俄(略)础(略)金(略)B(略)
项目主持人
Л(略)в(略)я(略)Н(略)и(略)ф(略)в(略).(略)
项目受资助机构
未(略)
立项年度
2(略)
立项时间
未(略)
项目编号
1(略)6(略)5(略)
项目级别
国(略)
研究期限
未(略) (略)
受资助金额
0(略)卢(略)
学科
未(略)
学科代码
未(略)
基金类别
((略) (略) (略)6(略)«(略) (略)ц(略)и(略)е(略)у(略)е(略)о(略)ы
关键词
未(略)
参与者
未(略)
参与机构
未(略)
项目标书摘要:Ан(略)аявке: Пр(略) с актуал(略)й разрабо(略)нных лекс(略)урсов, по(略)а материа(略)ных корпу(略)ания комп(略)струменто(略)лексикогр(略)ности, тр(略)ые компью(略)ологии, к(略)беспечива(略)тельный о(略)ративного(略) материал(略)цированно(略)ых значен(略)демонстри(略) разнообр(略)тов его у(略). Многоур(略)метка кор(略)ов, охват(略)сико-сема(略)морфологи(略)таксическ(略) виды лин(略)й информа(略)ает новые(略)и для реш(略)ных задач(略)кта - пре(略)ованную н(略)еских мет(略)огию авто(略) распозна(略)сте конст(略)занных с (略)й лексиче(略)ей (напри(略)укции, ре(略)го модель(略), констру(略)омогатель(略)м, адъект(略)аречным м(略)м, идиома(略)ороты и т(略)де исслед(略)лагается (略) процедур(略)ации конт(略)снове раз(略)орпуса, р(略)ексико-се(略) неоднозн(略)в, автома(略)ассификац(略)ций.В кач(略)ного линг(略)о ресурса(略)йствован (略)й корпус (略)ыка (НКРЯ(略)ийся бога(略)тового на(略) также де(略)и многопл(略)азметки. (略)анных из (略)щью специ(略)ых лингви(略)роцессоро(略)получить (略)вых конст(略)русских с(略)ных, глаг(略)гательных(略)истематиз(略)струкции (略)вии с воз(略)нутри них(略)мантическ(略)огическим(略)ческими и(略)ниями.Рез(略)ледований(略)ется испо(略)разработк(略)разметки (略)го корпус(略)языка, а (略)оставлени(略)о словаря(略)нструкций(略)к отчету (略)там реали(略)та: В 2(略(略)и получен(略)ы по след(略)влениям:М(略)атывался (略)атическог(略)я лексико(略)кой неодн(略)слов в ко(略)опорой на(略)типы разм(略)а текстов(略)ие, грамм(略)лексико-с(略)е теги) и(略)ванием ма(略)чения. Со(略)терный ин(略)деления и(略)ции колло(略)тающий с (略)рпуса НКР(略)бран эксп(略)ый корпус(略)л для цел(略)уществите(略)имен).Пер(略)ксперимен(略)вались ко(略)аркеры зн(略)и леммы l(略)гические (略)ксико-сем(略)теги sem (略)и этих те(略)дены эксп(略) снятию о(略)ногозначн(略)ежиме обу(略)енировочн(略) Выявлено(略)чшие пока(略)ости и по(略)некоторых(略)ше 95%) д(略)при выбор(略) основных(略): 1) обра(略)кстной ин(略)дется с у(略)рованно и(略) тегов ле(略)мбинации (略) и лексик(略)ских тего(略)комбинаци(略)в тегов l(略) 2) оптим(略)на контек(略) при обра(略)х с учето(略)нно испол(略)ов леммы (略)-4; +5], (略)мбинации (略) и лексик(略)ских тего(略) это [-2;(略)+4], с уч(略)ации трех(略)в lex+sem(略)-3; +5]; (略)ный объем(略)ной выбор(略)ет от 100(略)текстов.В(略) эксперим(略)довались (略) построен(略)ающегося (略)чалась во(略)спользова(略) контекст(略)в, сформи(略)и анализе(略)ия однозн(略)для разре(略)означност(略)ных слов.(略)можность (略)а на прим(略)ительных (略)инструмен(略)r t:tool:(略)ди которы(略)лены мног(略)арандаш, (略)ножницы, (略)нозначные(略)еник, вес(略) метла, т(略). Результ(略)ментов св(略)ют о том,(略)стве регу(略)екстных м(略)трументал(略)ния как д(略)ных, так (略)значных с(略)ассматрив(略)твительны(略)я инструм(略)частей: л(略)ка (r:con(略)nstr), че(略)ncr t:too(略)и пр.; пр(略)е, обозна(略)е-либо от(略) характер(略)рументов:(略)резовый ((略) dt:plant(略) острая ((略)ysq) и пр(略)физическо(略): грести,(略)р.Третья (略)риментов:(略)илотные э(略) по автом(略)выявлению(略)й, в кото(略)ют имена (略)ьные. Для(略) целевых (略)ны списки(略)емых конс(略)аиболее ч(略)четания, (略)арную стр(略)лючающих (略)во, часто(略)ический т(略)стный мар(略)и иного з(略)евого сло(略) частотны(略)рактеризу(略)емантичес(略)
- (略)