以前上学的时候,有一个英语的上机课程,有好多同学都在看美剧《越狱》,想着看看剧就能提升英语,然后过个四六级,美滋滋。
但是一两季看下来,感觉没什么用,单词没记住,听力也没提升,盯着英文字幕看吧,一行字幕还没看明白就播完了。
其实是因为你看的美剧难度太高了,和自己的水平不匹配,又没有使用正确的方法。一个句子有 1 个单词不认识,有 1 个单词认识但没听出来,整个句子就看不懂了,甚至单词都认识但组合起来就不认识了。播放的速度又太快,上一句还没看懂就到下一句了,所以脑子就开始摆烂只看中文字幕。
这样看剧学习效果就差很多,所以我做了这款 APP《刷剧学英语》,官网 https://lingoview.com/ ,让大家在看剧的时候更有效的提升英语,刷高难度的美剧也能得心应手。
【隐藏字幕】 眼睛总是偷偷看中文字幕?可以在 APP 设置隐藏中文字幕,英文看不懂的时候再点击字幕,一键查看中文翻译。
如果你是英语大神,还可以中英文字幕都隐藏掉,直接盲听,听不懂了在点击查看字幕。
这样能让我们找到自己不认识的单词,不熟悉的语法,听不懂的发音方式,每一次查看字幕知道自己哪里是不会的,盲点是什么,所以才能真正学到东西,提升英语水平。
【单句循环】 视频播放太快,台词还没听懂,字幕还没看完,就到下一句了?
来试试 APP 的单句循环,专治听不懂!支持一键慢速播放,对初学者更友好。
听懂的台词一遍过,听不懂的多次循环强化记忆,形成机械记忆,下次看到同一个单词,相同的句式就能更快的反应过来。英语小白也能练成无字幕看外语剧的高手。
【查单词】 点字幕中的单词可以直接查词典,有内置的单词释义,还可以快速浏览金山词霸、有道词典的释义。
【视频网站】 APP 自带浏览器,可以打开 bilibili、youtube(还有一些其他视频站也支持),b 站有现成的电影电视剧,还有些英语博主,可以在线看。 也支持播放本地的视频文件,下载文件再观看。
【生成字幕】 自动生成字幕、翻译字幕、对齐字幕。首次打开视频,稍等十秒钟就有字幕。免去到处找字幕、找到字幕还和视频对不起的烦恼。
安卓: react native,跨端框架,从 react 过来的,选 rn 好上手
mpv,mpv 是个视频库。刚开始做项目的时候,我想现在能播视频的 APP 这么多,这种常见的需求三两下就搞定了吧,然而很快就被打脸。安卓官方的 exo-player 支持的视频格式不全,有些浏览器能播的视频它播不了,更头疼的问题是性能问题,有的视频播放起来掉帧,seek 操作(定位到某个时间播放)反应太慢,单句循环的时候体验很差。后来又试过 exo-player + ffmpeg 解码,工作量巨大,放弃了。也试过 vlcplayer,最后选了 mpv。mpv 是个宝藏库,性能好,api 是命令方式,更方便接入。
expo, 用的是 expo-bare-workflow,但是纯粹的当成一个库使用,打包方式还和 react-native 一样(刚用 rn 以为用 expo 必须云打包,其实不是)
react-native-paper: ui 库
react-native-elements: ui 库,用的比较少
mobx: 状态管理
webview:浏览器用自带 webview 实现
silero vad: 语音检测
cpp, ffmpeg: 安卓有 cpp 代码,用来调 ffmpeg 接口,对接 libmpv。还有部分性能敏感的功能也用 cpp 实现,比如解析字幕、合并字幕。
后端:
java+python+postgresql
这是我第一次做独立项目,前前后后忙活了 11 个月,耗时相当长了,开始之前我也是想做一个能快速验证的项目,只是做起来发现难点有点多,而且我也没有开发客户端的经验,也是摸石头过河。
比如说播视频,看起来很简单的功能,播一个固定的视频文件很容易,但是播用户自己选择的文件、网页上的视频,就有很多意想不到的问题,性能问题,格式问题。把网页上的视频接入到原生的播放器,这块技术和夸克浏览器、ALook 浏览器是类似的技术实现,也花了不少时间,为了省流量整个视频文件在播放时做了分段缓存,一次下载,播放视频、语音检测、生成字幕可以多次使用。如果做成每次读取视频都重新下载,代码会简单不少,但是用户会感觉反应变了,流量跑的多了,所以用了个复杂一点的实现方式,也多花了不少开发时间。
生成字幕这块,用的 whisperx,再稍微做一点优化,自己部署的。这块倒是没有想象中那么高的成本,用不到大模型那种规模。
翻译用的豆包 Pro 接口,试过一些小模型效果很差,甚至豆包的 lite 大模型翻译的都是呆呆的。感觉翻译还是很吃模型规模的。有个 AI 产品的指标是 CAIR,是说用户对你产品的生成 AI 结果是否有信心,关系到你的产品是否容易推广,是否容易被采用。用大模型翻译的一个优势就是容易被用户信任,现在大家都觉得大模型这么牛逼了,各行各业都无所不通,翻译个英语岂不是杀鸡用哪个牛刀了,所以用户更愿意相信你的大模型翻译结果,不管结果怎么样,这比机器翻译接口都是个优势。以后还可以再扩展这块功能,用户觉得翻译结果不对,可以直接和 AI 聊,纠正这一句的翻译。或者让 AI 讲解语法。
还有个有意思的事情。百度的翻译 API 价格是 49 元/百万字符,其他翻译服务价格也大差不大,都是几十块钱,而豆包 Pro 的输出价格是 2 元/百万字符,通义的价格也是 2 元 / 百万字符,你没看错,大模型的价格反而比传统机器翻译便宜的多。价格相差了一个数量级。这块说不定也是个商机。
开发之前看过国内的一些看剧学英语的产品,没有支持视频网站 + 实时字幕的,《刷剧学英语》还是头一个。这两个功能是做得耗时最久的,不做又觉得完成度太低了,以前 pc 时代网民会找资源,下载文件,现在你很难想象用户会下载文件,传到手机再看了。看剧都是用 APP 或者网盘。影视剧基本上都是字幕嵌在视频里的,你在网上找字幕,要搜索、下载、解压、复制到手机、打开字幕,然后字幕时间可能还对不上,我相信用户已经没耐心这么操作了。
在给产品起名字的时候,我发现国外有很多类似的产品,你直接搜功能搜不到,直到搜名字发现名字被占用了,才知道还有这么个产品。 国外和这款类似,并且有下载量的有 VioceTube、LingoTube,都是播 YouTube 视频学英语的。VoiceTube 做得很不错,有用户量,但只支持 Youtube,这款《刷剧学英语》支持的视频网站更多,功能定位也有差异化,《刷剧学英语》能播本地视频,字幕合并、横屏播放也更适合看剧。
目前国内已上架小米商店,还是砍掉了主页视频推荐的。 在国内上架的真心不容易,备案和证书是卡点。上架华为商店就卡在 ICP 证了。
欢迎大家在官网下载试用 https://lingoview.com/
基本功能全部永久免费,生成字幕是每天有免费额度。有什么建议或者拍砖欢迎在评论区提出来!