Python的英语搭配助手应用开发研究
Python 的英语搭配助手应用开发研究
1 引言
英语搭配是英语中级学习阶段的必学内容,是评价语言学习者表达准确性的重要指标,一
定程度上决定着学习者能否顺利进入到英语学习高级阶段。国内外学者对于英语搭配进行了大
量的研究。
搭配现象最早被关注,可追溯至公元前 300 年,到 19 世纪后半叶,英语词语搭配开始引
起英语语法学者的关注,同时早期搭配研究都注意到了搭配与英语学习和教学的价值[1]。
研究最为重要的方向就是定义,界定问题是一切研究的开始。很多学者对于搭配进行了界
定,如 Firth 认为搭配就是具有惯常语伴的实际词语[1],濮建忠教授认为搭配是某一语法型式
(即类联接)下的多个词语的反复共现[2],,Sinclair 对于搭配的定义(两个及以上词语在较短语境里
的共现)为使用计算机研究搭配提供了可操作的量化界定[1]。
1960 年后,随着计算机语料库的飞速发展,有了海量数据、科学的统计方法等技术支撑,
让搭配研究飞速发展,语料库语言学推动搭配研究进入基于海量数据的定量研究。传统的同义
词辨析采取的是定义描述、翻译和少量例句等方法,但随着如 Sketch Engine 等大型语料库检索
程序的出现,学习者可以通过在语料库中检索关键词,观察包含大量实例的 KWIC 行,直观发
现同义词在搭配和语法上的差异,进一步通过统计方法计算出搭配强度量化,让学习者对搭配
特点和倾向一目了然[3]。濮建忠通过研究中国英语学习者语料库中的三个单词
(reach,attention,same)的典型类联接和搭配词,发现了中国学习者在词汇使用中存在的问题,以
及提出英语词块教学是词汇教学的重点之一[2]。陈万霞通过分析英语学习者在作文中出现的搭
配错误,以及寻找错误的成因,进而给出解决这些问题的建议[4]。高霞通过横断研究设计方
案,对我国中高级英语学习者的搭配掌握程度进行了研究[5]。
通过文献的简单梳理,可以发现,搭配研究主要集中在三个方面:1)搭配的定义、类型和
重要性;2)通过计算机语料库对搭配进行定量研究;3)学习者出现的搭配错误。但是,研究多
集中于理论和定量分析,应用也多关注搭配错误诊断分析,为学习者在写作练习中提供搭配辅
助的研究还不多见。
但是在实际的写作过程中,学习者可能会遇到不知道某单词的搭配或者不确定是否使用正
确,此时就会使用字典来查证。常见的方法是查询电子字典(纸质字典因为查询耗时较长及要
求相关字典,故不考虑)或者网页在线字典。但是存在的最大问题是不管哪种方式,学习者都
需要从当前编辑软件退出,然后跳转到相对应的电子字典应用或者登陆在线字典网页,然后输
入检索词进行查询,在应用或网页中查看单词的搭配词,在此过程中,还可能会因为出现的一
些不相关的干扰信息,如广告,而分心。总之,对于学习者来说,会因为频繁切换不同的界
面,过于烦琐耗时或者存在干扰信息而放弃查找搭配词,从而终止写作练习。
当一个人把注意力高度集中于一件事情时,会感到时间飞快,伴有愉悦心情等现象,称为
心流。王卫等通过研究表明及时的反馈可以影响心流体验,而心流体验对于学习者学习意愿也
有显着的正向影响[6]。沉浸体验,和心流体验类似,都是指因为全神贯注一件事而忽略时间的
存在的感知。张嵩等研究显示有沉浸体验的用户比没有这种体验的用户在线时间长,对学习来
说,沉浸体验可以让学习者学习时间更长。沉浸理论指出必须排除外界干扰,才能让学习者学习
达到最佳状态[7]。因此,本文的研究内容是如何让学习者在一个应用下进行英语写作,并支持
一键查询单词搭配的功能,这样可以最快地满足学习者查找搭配词的需求,同时不打扰学习者
写作创作的环境和氛围,即尽力打造利于心流体验的学习环境,从而帮助学习者提高英语写作
能力。
2 实现方法
该应用(Collocation Assistant)基于 Python 自带的GUI 工具包 Tkinter 来实现窗口视窗设计。
选用Python 语言的理由在于其语法简单,跨平台、内嵌大量模块,支持众多第三方包,大大降
低了编程的难度,同时 Python 语言最为接近人类语言,近年来受到越来越多的人员,尤其是非
计算机专业但有编程需求的人士,特别是文科研究者的青睐。
该应用的目的是让学习者在一个应用(不需要频繁切换应用程序)里完成一键查询单词搭
配,进而建立不打扰学习者写作的环境,因此该应用包括两个区域:文字编辑区和搭配查询结
果显示区,如图1所示。
具体用户操作路径为用户在文字编辑区输入写作内容,当需要查找某单词的搭配时,用户
只需在输入完该单词后,按下触发键(本应用定义为 shift 键),该应用就会去在线词汇搭配网站
(https://www.freecollocation.com)获取该单词的相关HTML 信息,然后通过正则表达式截取只与
搭配相关的信息,并进行页面呈现调整,最后在该应用的查询结果显示区呈现。例如,在图1
中,用户在文本区进行写作练习,想要知道 comment 的搭配,只需在输入comment 之后,按下
键盘shift 键,之后右侧的查询结果框就会显示来自在线搭配网站上关于 comment 各种搭配信
息。
图1 搭配助手应用界面
代码实现路径:
1)获取网页信息
使用 Python 内置库Urllib 相关模块,从目标网站(https://www.freecollocation.com)获取检索
“词的网页。如果没有找到检索词的搭配,网页显示 Can not find 检索词 in the collocation
dictionary”,则返回 1,再做后续处理。如果找到检索词,则保存该网页信息。
2)选取相关信息
通过分析网页特征,可以看出和搭配相关的信息,都储存在多个<DIV class='item’></DIV>
标签里面,每一个标签只存储一个词性,如 comment,可以做名词和动词,因此该单词在网页
里面的搭配词信息,就存储在两个<DIV class='item’></DIV>标签里面。搭配词的词性放在
<U></U>标签里,搭配词放在<B></B>标签里,例句放在<I></I>标签里。先用Beautiful Soup 对
该网页进行整理,然后使用标签提取相关内容,并且存到字符串中,以便下一步呈现。
3) Tkinter 窗口试图设计
摘要:
展开>>
收起<<
Python的英语搭配助手应用开发研究 1 引言 英语搭配是英语中级学习阶段的必学内容,是评价语言学习者表达准确性的重要指标,一定程度上决定着学习者能否顺利进入到英语学习高级阶段。国内外学者对于英语搭配进行了大量的研究。 搭配现象最早被关注,可追溯至公元前300年,到19世纪后半叶,英语词语搭配开始引起英语语法学者的关注,同时早期搭配研究都注意到了搭配与英语学习和教学的价值[1]。 研究最为重要的方向就是定义,界定问题是一切研究的开始。很多学者对于搭配进行了界定,如Firth认为搭配就是具有惯常语伴的实际词语[1],濮建忠教授认为搭配是某一语法型式(即类联接)下的多个词语的反复共现[...
相关推荐
-
2024年党建工作要点工作计划5篇供参考
2023-12-16 999+ -
2025年专题生活会对照带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”个人对照检查发言材料4110字文稿
2024-12-21 999+ -
2025年医保局局长、科技局领导干部专题“四个带头”方面对照检查材料2篇例文(附:反面典型案例剖析情况)
2025-02-09 458 -
2025年国有企业党委书记、市总工会党组书记民主生活会“四个带头”方面对照个人检查发言材料2篇文(附:典型案例、上年度整改+个人情况)
2025-02-09 507 -
2025年市委组织部部长、教育局党委书记生活会“四个带头”个人对照检查发言材料2篇文(典型案例+个人事项)
2025-02-09 627 -
2025年市财政局党组书记、局长、市检察院党组领导班子对照“四个带头”方面生活会个人对照检视发言材料2篇文(含以案为鉴反思、以案促改促治方面)
2025-02-09 509 -
市检察院党组、市财政局领导班子2025年生活会对照“四个带头”方面检视发言材料2份文【含以违纪行为为典型案例剖析】
2025-02-09 461 -
2025年市财政局领导对照“四个带头”生活会检视发言材料2篇例文【含以违纪行为为典型案例剖析】
2025-02-09 586 -
单位领导班子2025年聚焦“四个带头”生活会对照检查材料2篇文(含:典型案例剖析反思、落实意识形态责任制)
2025-02-09 758 -
2025年镇党委副书记、市科学技术局领导班子生活会对照“四个带头”检视材料2篇文【含违纪行为典型案例分析】
2025-02-09 257
作者:闻远设计
分类:其它行业资料
价格:免费
属性:4 页
大小:83.22KB
格式:DOCX
时间:2024-03-09

