4月是大模型频频迭代的一个月,也是中国大模型的集中发布期。这些模型更新迭代之后到底进化在哪儿,可能深度使用者最有发言权。本期嘉宾和他的团队也在过往的使用体验中,结合一些学术论文研究出了一套给大模型打分的标准——如果不是一个专业的技术人员,普通人也可以通过一些好玩的测试题目,区分国产大模型与GPT4到底有哪些不同。随着越来越多的大公司与创业公司加入到国产大模型的竞争中,本期节目我们也聊了聊,除了芯片困境,国产大模型到底怎么样,以及难在哪儿?【主播】泓君,资深媒体人【嘉宾】戴雨森,真格基金管理合伙人【你将听到】使用体验【03:18】大模型的使用体验:与七八年前的对话机器人很不一样【04:51】ChatGPT 20问游戏:理解规则+二分法查找【05:51】Midjourney:从V3到V5进化惊人,打开新的使用方式【08:48】手工更贵,机器做的更好:原创会越来越有价值【10:05】如何使用ChatGPT:更适合脑洞与头脑风暴评分系统【12:21】300个问题,如何设计出一套大模型的评分系统【15:22】GPT4评分80分,国产模型迅速从20分追到50分【16:43】麻辣螺丝钉与爆炒篮球,GPT的进化速度【20:05】两个月飞速进展:从聊天机器人到GPT4到AutoGPT【21:46】大模型也有类似于自动驾驶的五级分类【24:10】基于大模型的创业,早创业还是晚创业谁更有优势?国产大模型【29:12】国产大模型格局未定,但要先造船【32:13】大模型的终局是什么:赢家通吃?类公有云格局or百家争鸣?【34:50】不止是A100芯片,数据、算法、架构,都需要解决【36:59】中文互联网的数据不是问题?【38:33】AutoGPT初印象:既震撼又忧虑【40:43】微软可以一天训练一个GPT3,但只有它的超算才能训练GPT-4【44:01】GPT的价值观:目前还是加州白人男性价值观【46:38】潜在安全风险:操作选举,电话杀猪盘,垃圾信息【49:04】OpenAI的股权结构:收益权与控制权分开【53:00】做出OpenAI需要探索能力,第二个做更需要执行能力【54:54】这轮AI浪潮有泡沫也有啤酒,人类最大的一轮技术革命【57:04】未来不可预测,我所说的都是错的【59:04】技术成熟有利于成熟创业者,新技术反而利好年轻人【招聘】我们团队目前正在招聘全职的播客节目监制、视频后期、商务拓展以及运营,欢迎感兴趣的小伙伴把你们的简历和代表作品发送到我们的邮箱:Podcast@sv101.net。具体要求我们之后会发布在【硅谷101】的微信公众账号上,欢迎关注。【相关资料】真格基金的评分系统:大模型测试集Z-Benchhttps://mp.weixin.qq.com/s/D9xQYIw8K2OjVLBwzNtagQ【BGM】Cheese and Crackers【后期】AMEI【在这里找到我们】公众账号:硅谷101收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music联系我们:podcast@sv101.net