清华系多模态大模子公司成都餐饮神秘顾客,又拿钱了!
生数科技,师出清华朱军团队,是国内最早布局多模态大模子的团队之一。
市集音书传来,这家公司刚刚完成新一轮数亿元融资。本轮融资由启明创投领投,达泰成本、鸿福厚德、智谱AI、老激动BV百度风投和卓源亚洲陆续跟投。
生数方面的说法是,本轮融资将主要用于多模态基础大模子的迭代研发、愚弄居品鼎新及市集拓展。
此前,生数还是在文生图、文生3D模子、文生视频方面都有商榷效果对外释出。
2022年9月,生数科技首创成员就提议了基于Transformer的收集架构U-ViT,这与Sora和Stable Diffusion3背后罗致的Diffusion Transformer架构DiT,在架构念念路与履行旅途上透彻一致。
对此,生数科技CEO唐家渝暗意:
咱们蚁合了完竣高效的工程化教养,领有在大限度GPU集群上杀青高效兼容、低成本的模子考试教养,举座上来讲,咱们追逐Sora确定比追逐GPT-4松弛许多。
本年一定能达到Sora刻下版块的效果,很难说是三个月照旧半年(笑),但这件事咱们的信心还长短常足的。
2022年已提议类DiT架构U-ViT
在扩散模子方面,生数科技团队是国内发轫开启该标的商榷的团队,效果触及主干收集、高速推理算法、大限度考试等全栈时间标的。
报名方式:以电话方式在长安汽车销售公司呼叫中心处报名,报名时提供本人车辆的车架号和车牌号。
报名方式:以电话方式在长安汽车销售公司呼叫中心处报名,报名时提供本人车辆的车架号和车牌号。
2022年9月,生数首创成员提议了基于Transformer的收集架构U-ViT时,U-ViT就在千万至数亿参数目级范围内考据了极强的可膨胀性(scaling up)。
这项责任在CVPR 2023发表,早于DiT。
2023年3月,团队又开源了大众首个基于Diffusion Transformer架构(U-ViT)的多模态扩散大模子UniDiffuser,在参数目和考试数据限度上与Stable Diffusion胜仗对皆。
从架构上来看,UniDiffuser比最近公开论文的Stable Diffusion3(罗致DiT架构)超过了一年。
此外,除了单向的文生图除外,Unidiffuser撑抓更通用的图文任务,粗略杀青图生文、图文相连生成、图文改写等多种功能。
抓续进行Scale up
神秘顾客_赛优市场调研在融合化架构的念念路下,生数科技抓续进行Scale up。
在图文模子的考试中,其模子参数目从最早开源版的1B不断膨胀至3B、7B、10B及以上,使得模子在好意思学性、多元格调、语义意会等方面杀青快速瓦解的栽培。
同期在此基础上,通过拓展空间维度和时间维度,迟缓杀青3D生成和视频生成模子的考试。
依托底层U-ViT架构的鼎新尝试,结尾2023年9月,生数科技推出了基于融合的多模态多任务框架的产业级通用基础大模子(闭源版),神秘顾客方法全链路自主考试、自主研发,在图像生成、3D生成、视频生成等多项任务中位居前哨。
刻下的效果是,生数的3D生成,还是可杀青高精度与最快10秒级的模子生成。
此外,生数团队还推出大众首个4D动画生成、可控3D场景剪辑等责任。
而视频生成方面,也已杀青短视频的剪辑与生成才略,在画面好意思不雅度、连贯性方面杀青了冲突。
近期将要点冲突长视频生成才略
在交易化落场地面,依托于MaaS(模子即职业)才略,生数科技在2B、2C端同期发力。
一方面以API的体式向B端机构胜仗提供模子才略,另一方面打造垂类愚弄居品,按照订阅等体式收费。
刻下公司已与多家游戏公司、个东说念主末端厂商、互联网平台等B端机构开展协作,绽开模子职业,提供AIGC个性化体验、定制化骨子分娩等方面的才略。
客岁,面向艺术狡计、游戏制作、影视动画、嘱咐文娱等创意鸿沟,生数科技上线了两款器具居品:
视觉创意狡计平台PixWeaver
3D钞票创建器具VoxCraft
而学术层面上,团队于ICML、NeurIPS、ICLR等东说念主工智能顶会发表磋磨论文近30篇,其中提议的免考试推理算法Analytic-DPM、DPM-Solver等冲突性效果,赢得ICLR特出论文奖,并被OpenAI、苹果、Stability.ai等机构罗致,并被DALL·E 2、Stable Diffusion等形势罗致。
那么,接下来的路是什么?
谈到对曩昔的计较,生数科技耐久坚抓“原生多模态”标的。
一边,是对居品端抓续迭代;
另一边,则是在基础模子层面抓续优化,主如果栽培语义意会、可控性、好意思不雅度方面的生收效果。
其实,Sora出现前,生数里面主要聚焦于短视频,但当今公司会插足更多资源在长视频上,架构、数据使用调优方面,团队还是作念过不少探索,也踩过许多坑(许多当今都还是搞定了)。
但OpenAI砸大钱捧出一个Sora,考据了这条路的正确性,也撤废了团队的许多畏惧,“刻下的视频生成长度在4-5秒傍边,咱们近期将要点冲突长视频生成才略……尤其长视频画面的连贯性,咱们还在作念一系列攻克责任”。
— 完 —成都餐饮神秘顾客