单词频率分析是提高写作质量的一种方式

概括:查看使用单词频率软件如何帮助您改善写作

在1980年代的Windows 1.0的旧时代,有一个称为单词频率的工具,它随附MS Word Distribution包。作为使用英语作为第二语言的人,我用它来大量使用它,因为它帮助我改善了词汇量并纠正了可用拼写检查器能力之外的拼写错误。

该MS Word附加组件创建了文档中所有单词的列表,按频率顺序排序。它很容易检测到过度使用和/或滥用某个单词或表达。少用的单词也有帮助,因为有时我写信汤姆森代替汤普森,,,,代替大车,或拼写检查器未检测到的类似错误。

频率分析也可以用作建立某个作者的“签名”,作家的文化层面,使用lang语或技术术语以及其他写作功能的一种手段。可以将特定文本中使用的单词数量推断为一个人的总词汇。频率分析可以指责一些作家拥有10岁的词汇,或者是中文出生的2年英语学生的单词熟悉。

频率分析与“同义词”软件中提供的同义词字典相结合,可以帮助作者丰富其词典并避免滥用某些表达式。

这也是一种避免为需要使文本与源不同的人制作相同文本的方法,例如需要填写许多相似但不相同页面的网络内容作家,以及想要避免窃探测和指控的学生,正确或错。

pla窃检测还利用频率分析,因为将给定文本与整个网络内容进行比较是一项主要任务,并且检测系统不知道从哪里看和从哪里开始。因此,分析单词频率可以为给定文本的写作样式和作者身份提供一些线索,而无需索引整个内容。

搜索引擎使用单词频率来建立网页的主题。他们开发了复杂的语言分析,以便通过受试者在不干预的情况下对页面进行分类。反过来,网站管理员也这样做,试图欺骗搜索引擎以分配与他们创建的页面相关的高关键字。例如,使用具有3%频率的单词给出了该单词(或关键字,在搜索引擎上下文中)的文本良好相关性。仍然可以使用10%的频率,但是它接近“关键字填充”,这是一种试图强制其网站进入搜索引擎顶部的网站管理员使用的技术。关键字填充受到搜索引擎的惩罚,需要通过同义词软件或良好的写作技巧来防止同义词的智能使用同义词。

例如,本文具有以下单词频率:

单词:9,频率:7,使用:6,不是:6,搜索:6,文本:6,发动机:6,分析:5,CAN:5,使用:5。

总字数:694

分析后我本可以编辑文本,以避免用于语言目的的“单词”和“频率”。但是,搜索引擎优化目的是可以的(试图通过Google和Yahoo可以找到本文)。我还希望它在“写作软件”,“写作工具”和“同义词替代者”下进行索引,但是为了涵盖这些额外的关键字,我应该写一些更有意义的文本。下次...

是否有任何严肃的作家仍然避免使用有线计算机?可能没有多少人可以避免使用网络和搜索引擎来找到正确的单词,最常见的表达式,以执行拼写或语法检查。与在纸质,光盘或网络上使用字典相比,在Google中检查单词用法更快,更有效。搜索引擎列出了有史以来写过的每个单词,不仅像词典一样写得很好。

除了老式的拼写外,还要准备对单词频率,教育水平,技术性,行话和其他参数进行分析。

由于这些趋势,候选人的最终挑战是用纸和笔撰写文章。我们大多数人都不准备通过这样的测试。

版权©

允许在线印刷的许可已授予使用GUSHENGLISH.com。

关于作者:

Sergio R. Samoilovich是同义词器软件的作者,该软件正在发展为更复杂的机器辅助写作工具。在PC时代,他曾经通过TOEFL(用英语作为外语测试)。

喜欢这篇文章吗?

请帮助我们宣传:

TrustPilot
Baidu
map