文字转语音全方案,读网页、听书、读屏幕[电脑篇]

文章首发于公众号【小白书签】:https://mp.weixin.qq.com/s/ZSZra9dSi4SpBi7Riljj5g

小白之前分享了手机上使用 TTS(文本转为语音)工具的方法,今天给大家带来电脑上对应的使用方法,依然是从读网页听书(小说/文档等)读屏幕三方面来为大家介绍。

读网页

Edge 浏览器

想要朗读网页文字,电脑上同样可以使用 Microsoft Edge 浏览器。如果电脑是 Windows 10/11,系统预装了 Edge 浏览器,可以直接使用。

点击网址栏右侧“大声朗读”的A形按钮(也可以使用默认快捷键Ctrl + Shift + U,开始或停止“大声朗读”),开始朗读当前网页内容,并出现朗读操控界面。我们可以在此“暂停”或“开始”朗读网页,或者选择阅读上一段/下一段。同时在语音选项中还可以调整朗读语速,选择不同的语音发声人。

文本转语音1.jpg

如果只想朗读网页指定的部分内容,可以选中该部分内容,然后右键点击朗读所选内容即可。

文本转语音2.jpg

其他浏览器

不过,有些读者可能更习惯使用原汁原味的 Google Chrome(谷歌浏览器)或者更加本土化的 Cent Browser(百分浏览器)等软件。但是它们本身并没有朗读网页功能,想要为这些浏览器添加朗读功能,应该怎么办呢?

通常想要为浏览器增加功能有 3 种方法,一种是使用“小书签”,这种方式最轻量,直接借助浏览器本身的收藏夹功能即可;一种是安装相应功能的扩展程序;最后一种是使用“油猴”脚本,只是使用脚本的前提也需要先安装“油猴”类扩展程序,比如 Tampermonkey(篡改猴)等插件。

小书签

小书签(英语:bookmarklet),又叫书签小程序,是一种具有特定功能的浏览器书签。与常见的网址(URL)形式书签不同,小书签一般是 JavaScript 程序代码(也可能出现在网页中)。当用户点击这个小书签时,就会执行代码表示的动作。

比如想要实现朗读网页文本的功能,可以使用下方代码。直接选中下方代码,然后拖放加入到浏览器收藏夹,一个小书签就算添加制作好了。当然,您也可以手动添加,把任意网页加入书签,然后编辑修改书签的网址为以下内容就行了。

javascript:(function()%7Bvar e%2Ct%2Cn%2Co%3Ddocument%2Ca%3Dwindow%2Ci%3Do.getElementById("selectnspeak_bk_control")%2Cl%3D%5B%5D%2Cs%3D""%2Cp%3Dnew SpeechSynthesisUtterance%2Cc%3Da.speechSynthesis%3Bfunction r()%7Bvar t%2Co%2Ci%3Ba.getSelection%3Fs%3Da.getSelection().toString()%3A(n%3Da.selection)%26%26"Text"%3D%3Dn.type%26%26(s%3Dn.createRange().htmlText)%2Cd()%2Cs.length%3F(p.text%3Ds%2Cp.voice%3D(t%3De.selectedOptions%2Co%3Dt%26%26t.length%3Fe.selectedOptions%5B0%5D.getAttribute("data-name")%3A""%2Ci%3Dnull%2Cl.some(e%3D>(i%3De%2Ce.name%3D%3D%3Do))%2Ci)%2Cc.speak(p))%3Aalert("Select %26 Speak%3A Please select some text before pressing play.")%7Dfunction d()%7Bc.cancel()%7Dfunction x(e%2Ct%2Cn)%7Bvar a%3Do.createElement(e)%3Breturn t%26%26t.forEach(e%3D>%7Ba.setAttribute(e%5B0%5D%2Ce%5B1%5D)%7D)%2Cn%26%26(a.style.cssText%3Dn)%2Ca%7Dfunction g(e%2Ct%2Cn)%7Bvar o%3Dx("button"%2Cnull%2C"margin%3A10px 5px%3Bvertical-align%3Amiddle%3Bheight%3A32px%3Bwidth%3A32px%3Bbackground-color%3Awhite%3Bcolor%3Ablack%3B border%3A1px solid %23333%3Bwhite-space%3Anowrap%3Bpadding%3A2px%3Bborder-radius%3A 6px%3B")%3Breturn o.innerHTML%3De%2Co.title%3Dt%2Co.onclick%3Dn%2Co%7Di%3Fe%3Di.getelementsByTagName("select")%5B0%5D%3A[1] … 继续阅读.id%3D"selectnspeak_bk_control"%2Ci.style.cssText%3D"font-family%3Asans-serif%3Bborder%3A1px solid %23bdbdbd%3Bpadding%3A 6px 10px%3Bposition%3A fixed%3Btop%3A 10px%3B left%3A 10px%3Bbackground-color%3Argba(236%2C236%2C236%2C0.9)%3Bwidth%3A 250px%3Btext-align%3A center%3Bz-index%3A9999999%3Bbox-shadow%3A 0px 0px 17px -3px rgba(255%2C255%2C255%2C1)%3Bfont-size%3A16px%3Bbox-sizing%3Aborder-box%3Bborder-radius%3A 6px%3B"%2Ci.innerHTML%3D'<div style%3D"font-size%3A18px%3Bfont-weight%3A600%3Bborder-bottom%3A1px solid%3Bpadding%3A 7px 0%3B">Select %26amp%3B Speak Controls<%2Fdiv>'%2C(e%3Dx("select")).style.cssText%3D"width%3A 100%25%3B"%2C(t%3Do.createElement("option")).disabled%3D!0%2Ct.textContent%3D"Select a voice%3A"%2Ce.append(t)%2Ce.onchange%3Dr%2Cl%3Dc.getVoices()%2CsetTimeout[2]function()%7B(l%3Dc.getVoices(.forEach(t%3D>%7Bvar n%3Dx("option"%2C%5B%5B"data-lang"%2Ct.lang%5D%2C%5B"data-name"%2Ct.name%5D%5D)%3Bn.textContent%3Dt.name%2B" ("%2Bt.lang%2B")"%2Ct.default%26%26(n.selected%3D!0%2Cn.textContent%2B%3D" -- DEFAULT")%2Ce.append(n)%7D)%7D)%2C30)%2Ci.append(g("%26%239654%3B"%2C"Speak current selection"%2Cr)%2Cg("%26%2310074%3B %26%2310074%3B"%2C"Pause%2FUnpause"%2C(function()%7Bc.speaking%26%26c.paused%3Fc.resume()%3Ac.pause()%7D))%2Cg("%26%239724%3B"%2C"Stop all playback"%2Cd)%2Cg("%26times%3B"%2C"Stop playback %26 Close controls"%2C(function()%7Bd()%2Ci.parentNode.removeChild(i)%7D))%2Ce)%2Co.body.append(i))%2Cr()%7D)()%3B

使用则更加简单,选中需要朗读的内容,然后点击该书签,即可开始朗读!

小书签相对于扩展或者油猴脚本,尽管功能方面往往比较单一,但它有另外两者无法比拟的优势。那就是小书签再多,也不会占用更多内存和影响浏览器速度,更加不会出现兼容或者与其他扩展脚本存在冲突的问题。

扩展

可实现朗读网页的扩展有很多,比如:NaturalReader – AI Text to Speech、Read Aloud: 文本语音朗读助理、文本阅读器(文本转语音),这几款插件效果都不错。

使用没什么难度,使用方法也是大同小异,跟 Edge 浏览器用法也很相似。点击扩展按钮,一般为朗读网页内容,也可以选中部分内容后右键,点选扩展提示进行朗读。

脚本

脚本方式其实跟小书签有点类似,只是需要借助“油猴”扩展。由于小白发现很多 TTS 脚本都不更新失效了,目前没发现有什么好用的,就不细说了。如果您有推荐的,也可以反馈给小白!

听书

相对于在手机听书(文档),电脑上有更多方法可供选择,下面给大家介绍小白知晓的几种。

浏览器

因为常见的电子书格式,如 TXT、PDF 等,是能通过浏览器直接打开的。那么,我们就可以参照上述“读网页”部分的说明,来借助浏览器的朗读功能实现听书。

例如,我们可以在 TXT/PDF 电子书上右键,打开方式选择“Microsoft Edge”浏览器,然后使用这款浏览器自身的“大声朗读”就可以了。

聪明的读者可能会想到, 在手机上是否也可以通过类似的方法来朗读文档呢?理论上是可行的,不过对于长篇的文档或电子书,保存阅读进度等操作应该都不太方便。因此,手机上还是更加推荐“阅读+MultiTTS”之类的方法,这种方法其实可以照搬到电脑上。

MultiTTS+APP

此方法我们在上次“手机篇”中介绍过,想要在电脑上安装使用,只需要额外安装一款安卓手机模拟器软件即可。电脑上可用的模拟器软件有很多,像“雷电模拟器”或“MuMu模拟器”就都挺不错。

模拟器就相当于一部安卓手机,其余操作参照“手机篇”中的介绍就行,不再赘述!

ChatTTS

除了上述方法以外,也有很多在线网站或软件工具(一般是借用微软的语音接口,合成声音参考 Edge 浏览器)可供我们把文字转换成语音。不过无论是在线网站还是这类软件,往往过渡依赖开发者,一旦开发者不再维护,工具也往往也会随之失效。因此,此类工具就不做推荐了。下面着重介绍下最近非常火,基于 AI 技术的工具——ChatTTS。

ChatTTS 原版对于普通用户来说不算友好,因此下面推荐几个基于 ChatTTS 打包而来,Windows 系统电脑解压即用的离线整合版本。

ChatTTS webUI & API

一个简单的本地网页界面,直接使用 ChatTTS 将文字合成为语音,同时支持对外提供 API 接口。

下载压缩包,解压后双击 app.exe 即可使用(它会自动启用电脑默认浏览器打开操作界面)。英伟达显卡大于 4G 显存,并安装了 CUDA 11.8+ 后,将启用 GPU 加速。

ChatTTS_colab

基于 ChatTTS,支持音色抽卡、长音频生成和分角色朗读。

使用方法与 ChatTTS webUI & API 类似但更为直观,简单易用,同样无需复杂的安装操作。

ChatTTS 三合一升级版

所谓三合一,是指整合了官方原版+上述两个的操作界面和功能的版本。拥有多人对话、固定音色、长音频等功能,自带多种音色!

解压缩后,运行下方任意一个 bat 文件开始使用。注意不要同时开启多个,不然 CPU 会爆满。

  • • go-webui.bat:对应原版操作界面
  • • go-webui-api.bat:对应 ChatTTS webUI & API 的操作界面
  • • go-webui-mix.bat:对应 ChatTTS_colab 的操作界面

使用 ChatTTS 可以获取媲美真人发声的音频,不过目前对于听书尤其是长篇文字而言,并不算太合适。因为它对电脑硬件有一定要求,生成速度取决于电脑配置。配置高,可使用显卡加速的话,生成速度还算可以。反之,单纯依靠 CPU 生成就比较吃力了。此外,如果您的网络状况良好,也可以尝试使用在线版。

读屏幕

电脑上的朗读屏幕功能,同样属于“辅助功能”之列。以 Windows 11 系统为例,打开系统“设置” – 辅助功能 – 讲述人,打开开关,会出现如下界面:

文本转语音3.jpg

然后,根据讲述人主页的入门提示和操作指南使用就行了。

工具下载

包括几款 ChatTTS 的 Windows 整合包以及 cuda 等,其中 cuda 在电脑使用英伟达(NVIDIA)显卡且显存大于 4G 时才需要安装,不然安装了也不会使用显卡加速。

https://pan.quark.cn/s/9ca3ed68514d

https://pan.baidu.com/s/12GF1ATcZBo1A9y9xtwuCkQ?pwd=69×4

0

评论0

没有账号?注册  忘记密码?

社交账号快速登录

微信扫一扫关注
如已关注,请回复“登录”二字获取验证码