第四十五期|张翔产品总监:AI工具在自媒体运营领域的应用

发布时间:2024.06.14 10:02

11月3日15时30分,北京师范大学知行书院主办的知行讲坛第45期《AI工具在自媒体运营领域的应用》讲座在乐育楼C108顺利举行。本次讲座由数字生命科技XFile产品负责人张翔产品总监主讲,知行书院副院长钱正荣老师主持,来自全校各学院、书院的共计80余名同学参加了本次活动。

张翔,数字生命科技XFile产品总监。计算机图形学硕士,视觉设计、法学学士,主要从事计算机底层运行逻辑研究和人工智能算法。曾在香港中文大学-香港理工大学 Mlab 担任研究员。先后任职大唐电信、国家电网、工商银行,担任产品、架构、项目负责人等角色。

本次讲座内容丰富、脉络清晰,张翔产品总监主要从五个方面对AI工具在自媒体领域的应用展开了论述。

首先,张总监指出计算机科学是一门不同于社会科学和自然科学的“特殊”学科,讲到了计算机运行的底层逻辑,并举了《道德经》的例子向我们生动形象地介绍了计算机的构建性。

随后,张总监向我们讲解了人工智能图像的生成原理,本质上是基于数学的构成体系。

接下来,张总监向我们推荐了一些具有代表性的Al工具,包括Al文本工具、A1音频工具和Al图片/视频工具三种工具。

计算机科学是一门“特殊”的学科,它既不属于社会科学,也不属于自然科学,而是一门独立存在的学科。它能够帮助我们构建世界。在应用方面,计算机科学能与各个专业领域融合,具有交叉性。

随着计算机科学的发展,二进制编码表所包含的内容越来越多,经历了从ASCII编码表到GBK再到UTF-8的发展过程。

但是,二进制的解释具有局限性,它只是一个数学描述,并没有体现计算机的构成逻辑。

相比二进制,《道德经》的内容更加体现出了计算机的构建性。

首先是“道生一”,基于一种判定逻辑,得出一个确定的“是”;然后是“一生二”,在得到一个“是”的同时,“否”就对应产生。接着是“二生三”,将“是”和“否”组合,就生成了一个新的概念。最后是“三生万物”,不断增加符号数量,就可以得到无数个唯一的概念。易经中,太极生两仪,两仪生四象,四象生八卦,也是同样引用了二进制的基本逻辑。

接下来张总监介绍了人工智能图像生成原理,人工智能图像的生成原理与数学密切相关,是基于数学的构成体系。

首先是十六进制,包含了0、1、2、3、4、5、6、7、8、9、a、b、c、d、e、f这16个数学符号。计算机中的每一种颜色,都有一个唯一的十六进制编码,即“色码”。

其次是卷积运算,图像的数学逻辑最终能够表达成一个函数。当我们正向利用这个函数时,就表示为图像的识别,当我们反向利用这个函数时,就表示为图像的生成。

Al文本工具推荐

1.Chatdoc

基于GPT4.0,具有强大的文本解析和分析能力,但缺少生成类的功能。

2.Aminer

学术类资料的生成能力较强,但底座模型一般。

3.XFile

可以自行训练,具备强大的可塑性。兼有文本解析、内容生成、自主训练的集中能力,但是其价值高度依赖于训练规模。

Al音频工具推荐

1.Text-to-speech

能够将文本转换成声音,但不具备克隆声音的能力,可以免费使用。

2.Stable Aidio

功能强大,可以生成音乐、克隆声音,但需要付费。

3.Mubert

具备强大的音乐生成能力,能够模仿各种乐器,缺点是需要付费。

AI图片/视频生成工具

1.Stable Diffusion

功能强大,可以依托各种插件生成图片、视频等,但是需要本地安装,使用者需要参加学习培训。

2.Diagram

生成图片的能力强大,图片效果好,特别擅长于生成适配口型对话的Al人物。

随后,张总监向我们提到,公司可以给书院师生提供一些支持,包括四个方面:一是师生可以申请XFile账号,免费开通自己的Al分身,进行训练,体验Al训练和输出的过程。二是学生可以报名参加粤港澳大湾区Al创作大赛。三是师生可加入群组,固定周二、周四开展SD的线上课程培训。同时,公司的产品公众号里也有教程的回放。四是欢迎教师与公司开展课题合作,公司可以提供技术和算力的支持。

最后,张翔产品总监向我们展示了XFile产品的界面和功能,书院老师和同学都对这款产品表示很感兴趣,并围绕人工智能的发展、应用以及人工智能与人类的关系展开了探讨。

这次的讲座让同学们受益匪浅,不仅让同学们认识到了AI运行的底层逻辑,还加深了对AI应用的理解。认知是兴趣的基础,相信随着对AI认识的深入,同学们将会对这一领域越来越感兴趣,并在未来的相关工作中积极运用。