A
在科技的“巨流河”里,人工智能千帆竞发。
龙年伊始,人工智能Sora横空出世,豪气干云,举世震惊。这是继ChatGPT之后,美国人工智能公司“领头羊”OpenAI于2024年2月16日正式推出的“文生视频大模型”,它可将文字描述瞬间转化为长达60秒的高清视频。
Sora是人工智能模拟现实世界的一个里程碑。OpenAI并未单纯将其视为视频模型,而是“世界模拟器”。OpenAI官网是这样介绍的:“Sora能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅能理解用户在提示词中提出的要求,还能理解这些东西在现实世界中的存在方式。”
这就是:通过多模态数据,包括文本、图像、音频、视频等,来理解和描摹世界。从现有的60秒生成视频看,可包含高度细致的环境背景、复杂多变的镜头角度、富有情感的人物角色,总的来看,颇具大片质感与风格,人物和场景确实都很真切。
在示例视频中,有个Prompt(大语言模型中的提示词)的描述是:在日本东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。而在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头款款走来,不仅主体连贯稳定,而且还有多镜头,包括潮湿的街道地面反射霓虹灯的光影效果,从大街景切入到女士脸部表情的特写,甚至她脸上的雀斑都一清二楚。
还有一个视频是,蚂蚁在蚁巢内穿行,逼真得“纤毫毕现”,简直令人难以置信。如果是现实拍摄,那可相当麻烦;现在是“一键搞定”,十分容易。
Sora可谓是“爽啦”。作为“世界模拟器”,Sora确实大大降低了视频制作门槛,不是专家和专业人士,也能轻轻松松做到以文字生出视频,生成一个“全新的世界”——这不是“门槛太低”,而简直就是没有门槛。难怪特斯拉首席执行官埃隆·马斯克直接在社交平台夸张地感慨“人类输了”。
其实,马斯克自己的脑机接口公司Neuralink也很厉害。2月20日,特斯拉投资者索耶·梅里特在社交媒体爆料称,马斯克宣布,第一位植入Neuralink脑芯片的患者,已完全康复。 “进展良好,我们意识到了神经效应:患者只需用意念,即可在屏幕上移动鼠标。”马斯克如是说。
此时距离1月30日马斯克宣布“已将第一颗大脑芯片植入人体”,还不到一个月。那时他说,“第一个Neuralink产品,称为Telepathy(心灵感应),最初的使用者,会是那些失去四肢的人。”他和他的团队,希望这种最先进的脑机接口技术能让上亿人受益。面对这种让人“回生”的特殊的人工智能,网友感慨:“世界若无马斯克,科技万古如长夜!”
还有,苹果Vision Pro于2月2日正式在美国上市,引发广泛关注。Vision Pro我称之为“威森炮”,很厉害的意思。它是苹果首款空间计算机,是一种“混合现实头显”,其中包含传感器、摄像头、显示器等,戴上就能把空间变成一个无边的“画布”,用手势、眼睛或者语音就可操作控制,过去科幻电影里头很酷的空间显示屏就呈现在眼前。
人工智能达到“引爆点”,带来泼天富贵。美东时间2月23日,AI芯片巨头英伟达大涨,总市值突破2万亿美元,而从1万亿美元到两万亿美元,英伟达只用了8个月。此前在2月21日,英伟达公布劲爆业绩,四季度营收221亿美元,同比猛增265%。AI概念股掀起全球股市狂欢,未来向好。
B
看到未来的趋势,相对还是容易的。很多年前,我在跟一位知名企业的领导人探讨未来发展趋势的时候,我就说互联网时代之后,将会是人工智能时代。
人工智能时代飞速到来,不断改变着现实和未来;而未来最大的产业,无疑就是人工智能。
现在还是人工智能的爆发初期。“Sora视频大模型+Vision Pro苹果头显+Telepathy脑机接口”,就是突飞猛进、遥遥领先的、以人工智能为核心的科技成果。
美国互联网科技公司Meta的首席人工智能科学家、图灵奖获得者杨立昆,尽管批评Sora不是“世界模型”,认为“生成式路线注定失败”,但他说:“未来每个人与世界互动都将由AI为中介。”
中国360公司董事长周鸿祎则预测,一旦AI能够接上摄像头,把所有电影和互联网上的视频都看一遍,就离AGI(通用人工智能)真的不远了,这一天可能在一两年内就会到来,而非十年或二十年。
其实就在 Sora 发布的同一天,另有两款重磅产品推出:一是谷歌发布大模型矩阵的最新力作Gemini 1.5 Pro;二是Meta发布“能够以人类的理解方式看世界”的视频联合嵌入预测架构V-JEPA。
“未来已来”,尤其是Sora这样的大模型,为数字经济创新发展打开了一扇大门。
然而,科技常常是一把“双刃剑”,马上有人开始担心会不会因此被下岗、被失业了。“瑟瑟发抖”完全是有可能的。有人悲观预言,有很多传统领域可能被颠覆,其中最为岌岌可危的大概会是计算机图形学、短视频和影视娱乐行业,从业者不得不面对不断被更新、被转型,甚至被抛弃。
比如,随着Sora的横空出世,有人预计科幻电影《流浪地球3》的摄制团队,可能会从《流浪地球2》的2000多人,减少到只剩几百人。
也有人预计,“被人工智能增强的人类,将会在未来几年之内,通过人工智能创作出最杰出的作品”。所以,对于不断出现的人工智能的“王炸”“深水炸弹”“降维打击”,不能没有思想准备。
好在无论Sora怎么变,最初输入的文本,还是要靠人去写,“世界模拟器”先要有“文字描述”“文字模拟”“文字想象”,这需要人工而且是优质人工,否则的话恐怕难以生成真正的“电影大片”、成为“永恒经典”。
C
从生成文字,到生成图片,再到生成单镜头,最后生成视频影片,进步迭代极为迅速。
构建Sora这样的复杂系统,人才第一、数据第二、算力第三,这三者相辅相成,都难以被替代。
人才第一,人才为本,因为数据和算力都来自人才。如果人才储备不够,那么一切都会变成空谈。华为领导人任正非的脑子一直很清醒:中国人工智能不可能快速发展,因为中国缺数学家。
人工智能领域,最多、最优秀、最前沿的人才,都聚集在美国,其中包括许多华裔科学家,这是不争的事实。
人才有力,算力才能出“大力”。都说Sora属于“大力出奇迹”,这个大力不是别的,就是算力,有赖于超级芯片的算力。
马斯克这次不无遗憾地透露:特斯拉早在1年前就掌握了类似OpenAI的视频生成技术,它的真实世界模拟和视频生成是“全世界最好的”,奈何受限于算力不足。
算力需要“无极限”。现在也正是因为算力限制,人工智能创作的文章、图片画作、视频,还没有彻底摆脱“机械化”的特征。
随着人才的不断进步、大数据的不断增加、算力的不断强大,相信Sora将会越来越完善,最终带来颠覆性的变化。
科技研发就是这样:过去异想天开,今天勉为其难,未来习以为常。我们知道,从0到1是最艰难的突破,从1到10则是改进发展——其实,1到10的进步也不是很容易,但人家一直在努力。
试想一下这样的情景:Sora能够随时轻松地生成“名师精彩授课场景”,那就打破了教育的时间和空间的界限;在山区的孩子们,可以不离家乡,通过视频课程、在线作业和虚拟实验,就能“想学啥就学啥”,能够身临其境地在世界各地名校游学,这是何等惬意!那样必然会缩小教育差距,大大增加教育机会均等化。
而且,好的教育离不开想象力,在非凡的想象力中接受教育,那多么美妙!
但也要看到,“科技贫穷”会限制人们对科技进步发达的想象力,尤其是对科技未来的想象力。
D
科技无极限,后发无优势。后发者只能老老实实奋起直追,千万不能是“人家在忙于人工智能,你却忙于人工智障”。
复旦大学有一位三天两头发表高见的姓张的名人,日前发表演讲说:“现在中国已经走在第四次工业革命的最前沿,不少领域内清场式的遥遥领先,非常厉害。”听清楚了,人家说的可不是一般的“遥遥领先”,而是“清场式的遥遥领先”,这意思是把美国等发达国家的前沿科技都完全抛在身后、抛到场外,彻底清理清除干净了,不见踪影了……还真是口嗨得欢。
问题是,上上下下无数多人都爱听这样的妙论、高论,听了开心得不得了。确实,这个世界已经泾渭分明地分成了“人工智能世界”和“人工智障世界”。
2月22日,澎湃新闻发布《美院博士成AI名师?直播2小时卖课20万?AI课程乱象调查》的报道称:近日,自称清华博士的抖音网红“李一舟”通过售卖AI课收入高达5000万的相关信息刷屏网络,不少人质疑类似的课程是在“割韭菜”。目前在抖音、知乎、B站等社交媒体上,类似李一舟的AI课程随处可见。“AI培训课从去年3月开始兴起,今年年初,伴随OpenAI开发的Sora走红到达高潮。”
报道说:多位购买过李一舟AI课的网友,均对课程内容表示不满。“特别后悔,我购买了199元课程,几乎没有有用东西,最让人气愤的是,直播第二天就要求学员升级到他的高阶课,需花费1980元,199课程啥都没教,就要升级,完全是骗子的套路。”
原来,聪明的中国人,踩中的是“AI、直播、割韭菜的三重风口”。中美两个AI“教头”,一个专注于“卖课发家致富遥遥领先”,一个专注于“让人工智能遥遥领先”,这就是霄壤之别。
有人吐槽:“真心做技术研究的少,真心成赚钱网红的人太多”;“把外国的技术拿来,穿上马甲,就能打扮成国产技术”……问题是,现在连马甲都不穿了,只要买买“说明书”,就能赚大钱。
美国国务卿布林肯,近来爱用一个比喻来形容国家之间规则制定和实力竞争,以此警告美国——“如果你不在餐桌上,就可能会在菜单上”。这话本意是,你不参与规则制定,就只能接受别人制定的规则;你不参与国际体系的建构,就会被动地被拖入国际体系当中。但也细思恐极,无论是在政治领域,还是在经济领域,还是在科技领域,如果进入这种残酷竞争、缺乏合作的局面,那么谁安排、谁被安排?谁在“吃”、谁“被吃”?想想吧,在“口嗨”与“三重风口”中打转的人们,如何取胜美国?
生活在18至19世纪之交的哲学家黑格尔有句名言:“从本质上来讲,中国是没有历史的,它只是不断轮回重复着王朝的覆灭更迭,没有任何进步可以从中产生。”那意思是说,帝制中国所谓几千年的历史,都是物理时间的流逝、专制统治的回放,社会并没有发生质的变化。
那么,怎么变,如何变?自由创造的制度环境,是关键中的关键。我曾经写过长文章《文化因自由创造而繁荣》(详见《只是历史已清零》一书,广西师范大学出版社2012年5月第1版,第147页),同理,科技因自由创造而兴盛。谁都不能否认,自由是现代社会的第一生产力;而没有自由的科技创造,就是无源之水、无本之木,那就不会是科技“巨流河”,而是一潭死水。(作者系香港新闻社日本分社特约评论员)
|