eatgrass

eatgrass

V2EX 第 565641 号会员,加入于 2021-12-16 08:23:52 +08:00
今日活跃度排名 8938
根据 eatgrass 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
eatgrass 最近回复了
127 天前
回复了 eatgrass 创建的主题 职场话题 失业了,上海有没有自习搭子
@qxdo1234 免费 有网 有空调
127 天前
回复了 eatgrass 创建的主题 职场话题 失业了,上海有没有自习搭子
@zsj1029 那就露馅了
做得挺不错的
188 天前
回复了 gongxuanzhang 创建的主题 程序员 在一个群里被恶心坏了
技术问题能够自己查的答案的不要在群里问,技术群是最低效准确性最差的解决问题的地方
297 天前
回复了 Gcourage 创建的主题 Apple 在苹果设备上推荐什么阅读软件主要英文书籍
PDF: Skim
EPUB: Books
317 天前
回复了 jianchang512 创建的主题 分享创造 一个简单的本地语音识别服务
https://huggingface.co/spaces/Xenova/whisper-web
直接浏览器里运行,0 部署
364 天前
回复了 eatgrass 创建的主题 分享创造 Obsidian 英语单词词频高亮插件
@EngAPI AI 回答

COCA (当代美国英语语料库)和 ANC (美国国家语料库)都是用于语言学研究的书面和口头文本集合,但它们有着不同的特点和目的。

大小和组成:

COCA: COCA 是最大的美国英语语料库之一,包含超过十亿词。它包括来自口语、小说、流行杂志、报纸和学术文本的广泛文本。其数据在这些类型之间保持平衡,并定期更新,使其高度代表当代美国英语。
ANC: 美国国家语料库较小,大约包含 2200 万词。它关注于代表美国英语的书面和口头文本,但没有 COCA 那样的广度或定期更新。
时间跨度和更新:

COCA: COCA 的文本范围从 1990 年至今,且定期更新新文本。这种持续更新过程确保了语料库反映了当代用语。
ANC: 另一方面,ANC 没有那么频繁的更新计划。它的文本来自不同的时间段,但不一定反映最新的语言趋势。
目的和使用:

COCA: 经常用于语言学研究,COCA 是研究当代语言使用、趋势和随时间变化的强大工具。由于其全面和最新的特点,它也广泛用于教育,尤其是在作为第二语言的英语教学中。
ANC: 虽然也用于语言学研究,但 ANC 更专注于提供美国英语的快照。它通常用于比较研究或研究美国英语的特定方面。
可访问性:

COCA: COCA 可在线访问,并提供各种搜索和分析文本的工具,使其对研究人员、教育工作者和学习者来说很友好。
ANC: ANC 也可访问,但其界面和工具可能不如 COCA 的广泛。
总之,虽然 COCA 和 ANC 都是研究美国英语的宝贵资源,但 COCA 更大、更新更频繁、内容更多样化,使其特别适用于观察当前和发展中的语言趋势。虽然 ANC 较小,更新不那么频繁,但仍为美国英语提供了宝贵的洞察,特别是对于特定的研究目的。
364 天前
回复了 eatgrass 创建的主题 分享创造 Obsidian 英语单词词频高亮插件
@EngAPI 根据我知道的:
1. 这两个语料库是两个不同的组织独立做到,所使用的文章数据源肯定是不一样的
2. COCA 在使用上是有限制的,需要付费,OANC 可以免费使用
364 天前
回复了 eatgrass 创建的主题 分享创造 Obsidian 英语单词词频高亮插件
@EngAPI
词频是根据 ANC 语料库整理排序的,高亮设置给出词频边界值来确定单词落到哪个高亮上,颜色可以自己调
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5810 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 02:51 · PVG 10:51 · LAX 18:51 · JFK 21:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.