培训啦留学托福考试 > 中山托福培训

托福口语是机器打分还是人工打分

发布时间: 2025年05月12日 15:33

【2025年出国留学、雅思、托福、小语种、留学考试】专业咨询 >>

您好！我是刘老师，请问您想了解出国留学、语言考试吗？

点击咨询

托福口语是机器打分还是人工打分

大家比较关心托福口语的打分方式，下面我就和大家聊聊这个话题。

【托福口语】托福口语评分时人工还是机器

托福口语本次改革引入自动评分系统，其实这项计划早就在准备中了，这从ETS这份官方报告当中就可以看出，其实现在所使用的引擎已经是5.0版本的引擎，下面我们就来看一下托福口语机器评分的要点。

19年托福改革后，我们可以非常肯定地告诉大家，托福口语一定是机器批改，至少机器批改参与了每一位同学的评分过程。ETS官方公布的数据，最新版本的托福口语机器评分系统Speech Rater与人工评分的相关性系数是0.81。说实话，官方单纯的拿这么一个统计学系数摆在我们的面前，对于考生或者是托福资深教师而言是没有感觉的，这个系数到底是偏高还是偏低，究竟什么数值范围值得我们进行参考，根本就无从比较。

真人教师来核查的几率不是100%的，所以尽量不要在结尾处留太多的空白。这样机器肯定首先就会给考生扣分。但是为了防止教师来核查，复听，建议考生在备考托福口语的时候，学会掌控时间，尽量不要超时太久。再给考生一个小建议：在托福口语考试中，尽量不要停止说话，如果没话说就多说点套话，在平时的练习中，针对机经上的重点话题进行准备。

随着越来越多的年轻学生在世界范围内学习英语作为第二语言(English as a Foreign Language)，为青少年语言学生(Young Language Students)设计的标准化语言考试 (比如托福考试)。

变得越来越受欢迎。鉴于这一快速增长的趋势，需要更好地理解年轻学生的语言发展模式和语言表现的语言特征成为语言学教师的需求。根据2014年，两位口语测评学者Bailey&Heritage的研究，语言发展模式和语言表现对于语言学评估的创建提供指导和指导至关重要。ETS于是系统地进行实证研究：在青少年语言学生中检查其英语语言能力(English Language Proficiency)的进展以便验证青少年语言学生评估任务和评分标准，并为基于测试结果的提供有效性证据(Kane，2013)。

在目前ETS采用的机改Speech Rater的系统中，对于托福口语测评是何以科学、公正以及客观地对考生们进行评价的呢?根据ETS最新的一项研究, 自1996年就有语言学学者(Ginther et al., 2010; Towell, Hawkins, & Bazergui, 1996) 使用平均话语长度(mean length of run) 这项指标来对考生们的流利度进行测评。

通俗易懂的说法，就是在托福考试中你的所有"huh", "uh", "erm", "um", and “well" (filled pause)都会被计数，当频率高到一定程度，就会被认为是弱流利度，另一种就是沉默(silent pauses), 在整个口语回答的过程中如果出现长间断，那么系统会自动把你的口语归为弱流利度。而托福口语考试的不同任务(task)其对考生们的语言能力和认知能力都有所不同，因此在进行口语独立任务(independent speaking task)设计和口语综合任务(integreated speaking task)设计的过程中。

在这项研究中，青少年(YLS)与成人考生(Adult learner)的流利度水平在两个任务的机评效果中都出现了较为稳定的表现。因此我们可以得出客观结论，在口语流利度方面，考生们在口语独立任务和口语综合任务之间较少会出现流利度偏差。

最新的5.0引擎当中，最新版的引擎已经极为接近于真人阅卷者进行了评分，在ets官方所发布的资料当中，真人评分和机器评分的相关系数已经达到了0.81，换句话说也就是，ETS在告诉大家：我们这套系统已经做得挺好了，已经敢拿出来给你们看一看了。最为影响最终分数的3个影响因素，他们分别是：平均沉默时长，单词重复率，和语速。

今天我们再来看另外8个重要的影响因素。

很显然在这里排名第4位的影响因素，就是Total acoustic model score for all words with model trained on native data，看了这段生涩的语言，说实话无老师也有点要吐了。这个名词，还真有点不是特别好解释。总而言之，这个其实涉及到ETS在评分过程当中具体的一个流程，也就是在Speech Rater进行评分的时候，其实有一个关键性的步骤，就是让机器来识别，考生本人所说的英语是否是地道的英语，这个主要是从发音和节奏来进行判断，就是当你的口语越接近于地道的发音，那么你的分数越高，反之亦然。这个影响系数达到了0.81，因此也就有了下面第2条影响因素，Total acoustic model score with model trained on nonnative data。

如上的4条，是所有的影响系数高于0.7的影响因素，接下来所列出的7条，影响系数全都低于0.7且高于0.5，这也就意味着对于最终分数的影响，没有前面4条影响那么大，但是同时也比较重要。

其中4条高于0.6的影响因素分别是，

Average of chunk length in seconds——平均意群的长度

No.repetitions——重复程度

Score point with the highest grammatical similarity score——语法的相似程度

Total no. different lexical types——词汇的多样性

Average of chunk length in seconds——平均意群的长度，归属大类Fluency——流畅：影响因子0.66，

这意味着，句子如果全都是三个词，类似于I like you的简单句，那么得分一定会偏低，但是如果能多用一些固定搭配、或者一些修饰性的成分，使得这个句子一方面不脱离口语化，不会像书面语那么复杂，同时句式的内容也可以比较丰富和饱满，那么得分就会提高。当然这一条的解读还可以有很多的层次，无老师在此就先不一一展开了。

No.repetitions——重复程度，归属大类Fluency——流畅：影响系数0.61。

把重复程度放在流畅程度当中，说实话有点奇怪，既然放在流畅程度这个大类当中，估计在这里面所表述的是，你是否会出现结巴的情况，也就是会连续反复同一句话。

托福口语评分标准

口语“are rated by three to six raters”指的是每道题只有一位考官打分，但不同题目的打分考官可能不同，一位考生的六道题目最少会有三位考官，最多会有六位( 每道题一位)。最后评分不会特别偏重某类题型，比如说独立或综合。所以，总体而言，ETS 的评分用一个词来讲是：holistic，即，考虑考试口语内容的整体性。也就是说，ETS 口语评分标准不会因某个具体方面而出现偏重，如，在不影响理解的前提下，语音语调不好不会成为扣分原因。在holistic 这一标准下，ETS 的最重要考虑因素是：intelligible, 可理解为可以顺畅的让考官听懂考生的表述内容。在holistic 和intelligible 两个标准之外，对答题内容而言，有如下三个评分维度：

1.Structure

2.Content

3.Language

Structure，即结构，总体来讲，ETS 评分官特别希望考生能够在答题部分给出清晰的结构。其中结构要求主要包括：

1)主题句thesis statement：在开头部分明确地表明自己的观点。

2)过渡词：在中间部分有明显的逻辑连接词或表过渡的信号提示词。

3)结论：如果时间允许，做简单地总结。

content, 即内容。ETS 有如下要求：

1)主题明确：明确地给出观点。

2)简单明了：不要过多的使用bigwords 和复杂句型;用考生经常使用熟练的词汇。

3)细节论点到位：独立话题例子论点和细节提供详细;综合话题涉及听力和阅读部分分别提到的具体信息，如，Task5 的听力部分女学生提到自己很忙，困惑于时间的安排，最近需要：准备考试，写2 篇论文，还有一个志愿者活动要参加。ETS 对于细节的期待是：希

望考生可以将学生需要完成的事情：准备考试，写2 篇论文，还有一个志愿者活动要参加这些细节都囊括到自己的回答部分中。所以，可以看出，ETS 十分看重考生对听力和阅读部分细节信息的整理和转述。

language，即语言，语言的要求包括：

1)流畅：对语速的要求并不是越快越好。最好考生是sustained speed, 即能够以稳定的速度顺畅的表达自己的观点，中间偶有小的停顿可以接受。

2)语音：发音标准是前提，语音语调地道对分数有一定的积极影响。ETS 给出评分参考是：只要不影响评分官的理解，即使语音语调不好，也不会扣分或影响分数。

3)允许语法错误：ETS 口语评分原则中明确指出考生的表述中可以存在小的语法错误，但是语法错误不允许重复出现。

很多考生对于口语评分经常会抱有疑问，进而会选择复议。而口语成绩的复议成功率是有迹可循的。

托福口语评分标准哪一个点最重要?

托福口语评分采取 Holistic Rubric Standing(整体评分制)，即同时参照以下三个标准进行整体打分:Delivery(语言表达)、Language Use(语言使用)、Topic Development(话题展开)。但是，对多数中国考生来说，主要问题是 Delivery(语言表达)不够清晰、流畅，所以学习重心应该放在提高流畅性和清晰度上面。

托福口语是机器打分还是人工打分相关文章：

1. 清楚了解托福口语的评分标准

2. 4个层面进行阐述新托福口语考试评分标准

3. 托福口语几分算高及快速提分技巧

4. 托福口语考试多少分算高分

5. 中国考生在参加托福口语时总是低分的三大问题大剖析

6. 托福口语成绩复议一般多久

7. 托福口语考试一共多少道题

8. 托福口语备考到底要不要背?合理记忆才能助力口语提分

9. 这些问题你遇到过吗?托福口语备考的3大难点

10. 托福口语流利不是高分的保障

托福口语是机器评分还是人评分

托福口语是机器评分还是人评分：托福口语目前采用人工评分和机器评分相结合。托福口语机器评分是把答案录音老师再判分，口语满分为24分，转换为标准分后满分为30分。有4个评分标准，分别是4分、3分、2分、1分。

在19年托福改革后，托福口语机器批改的程度大大提高，至少机器批改参与了每一位同学的评分过程。ETS官方公布的数据，最新版本的托福口语机器评分系统SpeechRater与人工评分的相关性系数是0.81。

真人教师来核查的几率不是百分百的，所以尽量不要在结尾处留太多的空白。这样机器肯定首先就会给考生扣分。但是为了防止教师来核查，复听，建议考生在备考托福口语的时候，学会掌控时间，尽量不要超时太久。

再给考生一个小建议：在托福口语考试中，尽量不要停止说话，如果没话说就多说点套话，在平时的练习中，针对机经上的重点话题进行准备。

托福口语评分标准，托福口语中包含六道题，每道题只有45-60秒的作答时间，具体评分细则如下：

1. 每道口语题会被一位考官给一个原始分(0-4 之间的整数分)。

2. 一个考生的六道口语题，会被至少两到三位考官评分。

3. 六道口语题的分数加在一起(0-24分)，取算数平均值(0-4分之间，但会出现小数点后0/.83/.66/.50/.33/.16
六种不同情况)。

4. 该平均值根据一定的规则，转换为0-30分的总分。

托福口语要求：

第1、2题是独立回答题，要求考生就某一话题阐述自己的观点。准备时间为15秒，回答问题时间为45秒。问题被朗读出来，同时会出现在屏幕上。

第3、4题要求考生首先在45秒内阅读一段短文，随后把短文隐去，播放一段与短文有关的对话或课堂演讲。最后，要求考生根据先前阅读的短文和播放的对话或课堂演讲回答相关问题，考生有30秒钟的准备时间，然后进行60秒钟的回答。

第5、6题要求考生听一段校园情景对话或课堂演讲，然后回答相关问题。考生有30秒钟的准备时间，之后进行60秒钟的回答。

托福口语是谁批改的？

托福英语有机改也有人为批改
是由美国教授批改的（大部分是普林斯顿大学的）考场当地的英语水平（特别是口音）其实影响不大，他们考察的主要是逻辑。你想，印度人的口语平均分比中国人都高，肯定不是因为口音吧

托福考试机器批改还是人工批改

写作部分机器参与批卷也就是e-rater 因为最近由于金融危机如果全是老师批薪水ets付不起
当然人工还是要参与到写作评分中主要是为了防止机器有故障导致惨案发生
口语的话我相信机器不可能参与到批卷否则印度阿三或者日韩同志不就天天惨案了？

温馨提示：

本文【托福口语是机器打分还是人工打分】由作者教培参考提供。该文观点仅代表作者本人，培训啦系信息发布平台，仅提供信息存储空间服务，若存在侵权问题，请及时联系管理员或作者进行删除。

上一篇: 长春市腾翼出国留学咨询服务有限公司怎么样？

下一篇: 办理去泰国的留学签证需要多少钱，怎样办理

留学机构排行榜

留求艺客观公正的通过一年以来海量用户作为数据基础，通过已经咨询和学习的学员
对这些优秀留学机构评分进行汇总，统计分析得出口碑排行的培训机构。

新东方前途出国

新东方前途出国是新东方教育集团旗下专业的留学服务机构，专注于协助中国学子实现留学梦想。新东方前途出国留学机构拥有一支精英团队，专业的留学规划师为学生提供全方位的留学服务，包括留学规划、申请准备、签证面试等，支持学生们实现留学梦想

校区数：192 查看全部校区地址 >
- 好评率
  
  98%
- 性价比
  
  9.9
- 关注人数
  
  100000+
咨询该机构获取报价
推荐理由三

唐帅 / 平台资深顾问

新东方前途出国是新东方旗下唯一从事出国留学服务的专职机构。自1996年成立以来,已经帮助数万学子成功走出国门,圆梦海外。

推荐理由二

张腾丹 / 平台资深顾问

新东方前途出国拥有数千名经验丰富的留学专家，他们不仅具有深厚的海外留学背景，还拥有多年的教学、咨询经验，善于为客户量身打造留学方案。

推荐理由一

冯海侠 / 平台资深顾问

新东方前途出国拥有丰富的留学项目，包括语言培训、学士、硕士、博士等多种留学类型。无论客户是想要去美国、英国、加拿大等热门留学目的地，还是考虑到日本、新西兰、澳大利亚等新兴留学市场，都可以在新东方前途出国找到适合自己的留学项目。
新航道留学

新航道-中国英语培训领导品牌，由胡敏教授率领一批团队成员共同创办，提供雅思、托福、SAT、AP等出国留学考试培训，提供一站式英语学习服务。

校区数：111 查看全部校区地址 >
- 好评率
  
  96%
- 性价比
  
  9.6
- 关注人数
  
  100000+
咨询该机构获取报价
推荐理由三

张建光 / 平台资深顾问

专注出国语言培训15年，个性化、精品小班、全封闭学习模式，通过制订和实施精准的学习方案，使学员的英语能力和考试成绩在短期内得到迅速提高。

推荐理由二

Steven / 平台资深顾问

由胡敏教授创立，拥有自主知识产权的权威教材500余种，主要由高等教育出版社出版，其中《九分达人》和《托福真经系列教材》是出国语言培训使用率最高的教材。

推荐理由一

高颖 / 平台资深顾问

国内老牌机构之一；拥有教育界权威的出国留学考试团队，组建了“雅思梦之队”、“北美考试国家队”；从国际课程AP，IB到托福，雅思一应俱全。
新通教育

新通教育自成立以来，以360度全方位的留学服务，为20多万学生成功办理海外留学，与海外上千所院校保持良好合作关系，能够快速获得较新招生动态与专业申请细则，避免因为信息差造成申请失败，提升学员的申请成功率。

校区数：58 查看全部校区地址 >
- 好评率
  
  95%
- 性价比
  
  9.5
- 关注人数
  
  100000+
咨询该机构获取报价
推荐理由三

Eileen / 平台资深顾问

教学经验丰富，班型设置多样化，让学员在提升成绩的同时，熟练掌握海外学习所需的批判性思维、社会交往和团队协作能力。

推荐理由二

流光 / 平台资深顾问

国内知名出国留学培训品牌，校区遍布全国大中小城市，课程丰富，教学体系完善，拥有自己的名师团队，满足不同基础不同学习需求的学员。

推荐理由一

陈娟 / 平台资深顾问

26年专注教育培训，累积学员超过2000万，旨在为学员提供一站式终身学习服务，出国语言培训产品涵盖面全，满足不同需求的学生
斯芬克艺术留学

斯芬克国际艺术教育致力于服务艺术留学申请者、艺术爱好者，为学生提供全球最优秀的海归艺术导师及领先的创新艺术课程，帮助艺术申请者顺利实现艺术深造梦想，激发自身潜能，发现更广阔的艺术世界。

校区数：62 查看全部校区地址 >
- 好评率
  
  97%
- 性价比
  
  9.4
- 关注人数
  
  83126
咨询该机构获取报价
推荐理由三

欧阳玉雪 / 平台资深顾问

斯芬克隶属新东方一级子公司，跟新东方学校、在线、前途出国并列，是一家专注于国际艺术创新教育、作品集培训、艺术留学规划的专业教育培训机构。

推荐理由二

susan / 平台资深顾问

斯芬克的导师们都是毕业于中央圣马丁，罗德岛设计学院，普瑞特设计学院，纽约视觉艺术学院，普瑞特设计学院等知名艺术设计院校，专业度是没话说，再看2019年申请季帮助学生斩获offer3400+，足以证明斯芬克的实力！

推荐理由一

Fiona / 平台资深顾问

斯芬克成立比较久，算是行业的半个标杆，给人的感觉是很广阔，就是什么专业拿给他们都能做，但是否每个专业都能做精就不得而知了。但可以说每个学生的机构备选项里一定都有sfk。
留求艺

留求艺是一个专业的出国留学咨询网站，提供美国、英国、日本、加拿大、澳大利亚、新加坡、新西兰、香港、马来西亚等留学咨询以及外语培训服务。

校区数：23 查看全部校区地址 >
- 好评率
  
  99%
- 性价比
  
  9.2
- 关注人数
  
  75974
咨询该机构获取报价
推荐理由三

Fiona / 平台资深顾问

成立于2002年，留求艺创立于美国芝加哥艺术学院，专注艺术留学申请、作品集培训，名校名师多对一辅导，拥有上海、北京、广州、深圳、成都、长沙、南京、杭州、芝加哥等校区，助力数万艺术学子圆梦世界名校。

推荐理由二

Paul / 平台资深顾问

留求艺创立于2002年，专注艺术留学申请、作品集培训，名校名师多对一辅导。留学服务行业口碑还不错的咨询平台,深得广大学生和家长的信赖。

推荐理由一

流光 / 平台资深顾问

留求艺创立于2002年，专注艺术留学申请、作品集培训，名校名师多对一辅导。留学服务行业口碑还不错的咨询平台,深得广大学生和家长的信赖。