即将到来的可访问性反弹
在过去的15年里, 软件可访问性已经从一个小众的专业发展成为一个主流的期望. 直到2010年左右, 信不信由你, 对于一名法定失明的学生或员工来说,在完成相同的任务时使用与同龄人完全不同的软件,这并不奇怪. 现在, 随着通用设计运动的成功以及HTML和其他技术标准的提高, 这种迁就往好了说是采购方面的严重失败,往坏了说是一种非法歧视. 软件开发人员在前端开发的易访问性问题和基本概念(如标记控制元素和向辅助技术(屏幕阅读器)报告状态更改)方面接受了培训,这些都是专业开发人员代码测试过程的一部分. 尽管取得了这些进展, 两种截然不同的力量正在旋转,它们有可能阻碍技术更好地包容残疾人的趋势.
这些力量中较短期的是关于“重新执政”的争论.“自2020年以来,同步视频会议平台的大规模采用证明,在任何地方都可以参加商务会议. 而以前,在没有电梯的老旧建筑里,坐轮椅的人可能会被排除在外——不管是不是有意为之, 现在不是这样了,要么把他们带到极速那边, 找一个更好的位置, 或者准备好面对昂贵而不讨人喜欢的诉讼. 许多残疾员工了解到,由于这些限制,他们被排除在很多决策之外,他们会竭尽全力地争取在完全远程为他们提供公平竞争环境的情况下,保持他们所享受的包容性. 严格实行复职政策可能会让人觉得不公平, 对需要提供便利的残疾雇员的差别待遇或为避免此类冲突而采取的歧视性雇用政策.
对通用设计和更好的技术可访问性趋势的另一个威胁是大语言模型(llm)的出现。. 我在今年的百家乐app下载(go2sm)中讨论了法学硕士的重要性.com/edstate), 他认为基于法学硕士的ChatGPT是一个比我们以前看到的平庸写作有很大改进的生成器,并且令人印象深刻地展示了我们在自然语言提示的软件解释方面取得了多大的进展. OpenAI为在线视频行业发布的更令人兴奋的法学硕士产品是Whisper语音转文本引擎. 在写完这些之后,GPT-4模型推出了,生成了比普通文本更好的文本. Whisper仍然是一个非常令人兴奋的工具,“为什么”支持这一点.
在低语, Mozilla基金会的DeepSpeech是我希望能够成功的开源语音转文本引擎之一. 回到2018年, 我们通过实例讨论了语言模型在语音到文本问题中的重要性 秋季辅助帽檐. 自动字幕的语音识别准确性的限制因素是预测正在说什么词的能力, 通过对语言模型进行推理来执行的任务. DeepSpeech是在Mozilla的Common Voice语言数据库之上构建的, 一个道德上纯粹的数据集,因为它的所有内容都是自愿提供的:目前是3,209小时的语音数据. Whisper的数据集是从互联网上抓取的,其语音数据量是前者的211倍. 有了这样一个更大的语言模型,Whisper的表现大大超过了DeepSpeech.
Whisper赖以建立的法学硕士在伦理上并不像DeepSpeech那样完美无瑕. 关于ChatGPT只是一个剽窃引擎——基于从人们在互联网上分享的创意写作中窃取的语言模型生成文本的观察同样适用于Whisper(尽管我认为Whisper在提供准确的视频字幕方面提供了大量的公共利益)。. 反弹将是人们如何试图阻止建立法学硕士的公司获取他们的创造性成果. 我看到的建议包括一个更有牙齿的机器人.TXT类型的解决方案. 但是,让互联网上的文字和视频更难被机器阅读(以及辅助技术)获取,是另一个对残疾人造成严重后果的解决方案. 教育视频, 保护教师知识产权和学生隐私的解决方案是严格的内容安全:更好地保护视频(和字幕)访问的平台在该领域脱颖而出.
相关文章
而不是拼凑加州的无障碍标准, 伊利诺斯州, 欧洲, 还有其他地方, 当前的标准是由来自业界的广泛专家制定的,并由万维网联盟(W3C)作为Web内容可访问性指南(WCAG)发布。.
2017年11月17日
软件开发人员在前端开发的易访问性问题和基本概念(如标记控制元素和向辅助技术(屏幕阅读器)报告状态更改)方面接受了培训,这些都是专业开发人员代码测试过程的一部分. 尽管取得了这些进展, 两种截然不同的力量正在旋转,它们有可能阻碍技术更好地包容残疾人的趋势.
2023年10月4日
设计混合教室或会议空间的游戏名称是平衡远程和本地观众的包容性,同事有时将其称为“缩放者”和“房间者”,”分别. 下面是一些可以帮助你达到平衡的工具.
2022年7月15日
随着越来越多的学习材料上线,教育工作者需要确保所有学生都能访问. 了解显示低质量网络的局限性的节目.
11月5日2019
也许吧,但他们可能说的是“自动字幕”.“制作可靠的字幕是一项挑战,但教育视频迫切需要它.
2018年6月13日