自动采集与翻译 - 懒人站长的福利

千年骚狐
千年骚狐
千年骚狐
6
文章
0
评论
2020年5月6日 评论 479 1531字

网站的内容更新时一个站长必备的技能。我是一个比较懒的站长,自从工作以后,我的另一个网站狐狸影视城,就没更行,一年能发个10篇不到的文章。不是没有新的干货分享,也不是没有时间,而是懒。

所以前两天在我的 VipSystem.pro 插件里更新了一个新功能,让转载大神的博客内容,和翻译一体化。哈哈。这不刚做完这个功能,就迫不及待的发帖高兴一下。

比如哈,我想翻译灰猩猩(C4D软件大神)博客的一篇文章,关于Beeple大神的一段采访记录。

原文地址:https://greyscalegorilla.com/2019/12/beeple-short-film-free-download/

那么现在有了采集和翻译功能,转载博文有多快呢。接下来就见证奇迹。

 

内容采集使用方法

先在插件后台“商城设置 -> 基础设置”页面开启“采集与翻译”功能。然后进入发帖页面,就可以看到采集和翻译两个按钮

首先采集目标页面的标题和正文内容,点击“内容采集”按钮,输入文章URL地址。

内容采集是通过 file_get_contents 函数在服务端读取目标页面的源码,并通过正则匹配标题和正文内容,请确保服务器网络可以正常访问目标url。

点击“确定”按钮,开始获取源码并分析。如果长时间等待,可以多尝试几次。

采集到内容后,会自动填写到文章标题和正文内容区域。

需要注意的是,请在“文本”编辑模式下使用该功能。否则有可能会正文内容无法正确写入,比如上方截图中,标题内容已经自动填充,正文却没有。

不过有备选方案,正文如果没有自动填写,点击复制按钮。然后在“文本”编辑模式下粘贴即可。因为复制的内容是HTML代码。这也是保证了文章内容采集后排版不变,否则纯文本模式,还需要手动排版,那采集的价值就打折扣了。

完成后,切换到“可视化”编辑模式,检查具体内容和排版。看起来还不错,文章标题与超链接,图片都完美展示出来了。

需要注意的是,有些网站的图片使用了防盗链。那么采集后,图片会直接挂掉,这时候,你就手动转图吧。

文章转载采集并不新鲜,重点是一键翻译功能。

内容翻译使用方法

确保标题和正文内容已正确填写,点击商品设置中的“内容翻译”按钮,等待片刻,翻译完成后会弹窗。这里并不会第一时间弹窗提示。

当点击按钮后,会读取标题和正文内容,通过ajax异步到服务器,通过API接口发送到第三方翻译提供商进行处理,并等待翻译结果返回。

然后和原文进行自然段匹配,最后生成编排好格式的,包含双语的正文内容,返回文章编辑页面,弹窗提示,如下图。

和内容采集一样,如果正文内容没有自动填充,则点击弹窗中的复制按钮,在“文本”编辑模式下粘贴。然后返回“可视化”编辑模式查看结果。如下图:

该文章已在狐狸影视城发布,文章地址:https://fox-studio.net/35780.html

内容翻译的重点是翻译的精度。在原文中有软件名如 Cinema 4D、插件名 Octane 等专业名词都能识别并原文显示,以及用户的昵称如Beeple等等,更优秀的是,人名翻译完后,还有括号写出英文的。

翻译结果还是非常满意的。另外就是语句的通顺程度,虽然达不到100%,但是对于读者来说不大影响阅读的理解。哈哈。

从此,我爱上了发布新文章。。。。


5月10日(4天后)追更内容:

本来英文翻译的接口用的是阿里云,云市场中的API。结果前两天群里发布后,火了,哈哈。就有用户推荐直接使用阿里云官方的翻译接口。

然后我去阿里云的官方接口,测试了下翻译内容,结果还真的可以诶,比现在的翻译流畅度更佳。所以,等我更新新接口。当然这是今天的追更内容,更新后本帖子不会修改。所以如果你看到这里的内容不是5月10日左右,那么有可能翻译接口已经更新了。具体请在Q交流群询问:298964438

千年骚狐
  • 本文由 发表于 2020年5月6日
  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: