有趣产品咖啡馆 Funny café :一个能让你更快接触到更多新鲜有趣好玩产品的地方。我会寻找市面上有趣的独立产品,向独立开发者们进行一对一的访谈,挖掘优质产品背后不为人知的故事(文末可加入群聊,有彩蛋!)。
我是来自佛山大学的大三学生,专业是机械设计及其自动化。平时比较喜欢编程和捣鼓 ai 技术。高三高考完后开始接触 python,大一的时候做过开源软件 ai-gal。
说回这个项目本身,paper2gal,顾名思义,就是把论文(paper)转换(to)视觉互动小说(galgame)的项目,上传好的论文,会有二次元美少女陪着你在这里一起讲解论文的知识,又或者是制造一个场景,让论文的内容能通过这个场景以及展开的剧情来向用户解释出来。

当时正好导师布置了看论文的任务,但是我真的很多地方都看不懂,就想着用一种轻松的方式来阅读论文,而且我之前也做过 galgame 相关的开源项目,所以我打算将论文与 galgame 两个毫不相关的东西结合起来,看看能不能产生出奇妙的化学反应。

说实话,如果你体验过 paper2gal,其实会发现效果不是特别好。项目目前还没做一些算法的优化来增强论文知识检索。
可以期待一下后续的迭代,prompt 的话,目前用的是标准化 markdown 提示词限定规则来尽量约束 ai,同时使用 json 模式输出,以保证 ai 输出能尽量少地出错。
目前主要通过大模型的原生推理能力结合角色人设来解决。对于文本形式的公式和推导链,Gemini 3 能够很好地理解并进行逻辑重组。通过 Prompt 设定,让不同角色用自己的方式将晦涩内容转化为对话,尽量在保证准确性的前提下降低理解门槛。


至于纯图片形式的图表,目前版本暂不支持,但后续会通过引入多模态识别来完善这一体验。
说没有遇到困难是不可能的,但是其实没有想象中的这么困难。
我目前使用的是 vibe coding,如果我想让 gemini 改项目的一处地方,例如我在做角色表情切换的时候就头疼,因为 ai 始终没能改到一版我理想中的效果,而且可能会随着提问次数的增加,ai 会把一堆乱七八糟的改动也给加进来,会导致项目变得十分臃肿。
所以如果遇到 ai 改不好的地方,最多提问两三轮,如果 ai 还是改不好,就要回退版本到提需求之前,避免其他的改动,然后换一种思路提问,看看 ai 能不能正常的解决需求。
6、目前产品是免费使用的,如果用户量上来,推理成本会爆,会考虑进行商业化吗?未来会有哪些迭代方向?
未来的话,有优先考虑做多选项支持,就是,像 galgame 那样,ai 可能会提一些问题,让用户有思考的机会,不过答错了也没关系,ai 也会耐心的给你解释。
其次是图表增强,支持图片格式的图表和数据,以及加强数据的处理方法。然后在对话的过程中,ai 会在合适的时候将数据图表展示给用户。
如果要说游戏性和论文实用性的比例的话,我目前是打算做三七开,游戏性 7,实用性 3,目前针对论文解读的工具市面上已经有很多了,没必要再挤进去。
总体定位其实是不变的,还是以游戏性为主,但是鉴于目前对于论文解析的效果实在太差,所以最近的迭代方向还是以增强 ai 解析论文的方向来做,我希望的是在达到一定水准的论文解析的能力上,能给各位论文阅读者带来更大的放松和愉悦。
2、加载过程中的小游戏好像大家都点不到🤣,你自己能点到吗?这个在观猹里还挺多人有提到的,这块你复盘过原因吗?
确实存在这个问题,首先要跟大家说一声抱歉,其实我自己也很难点到,我当时想的是这个游戏只是无关紧要的一环,所以就没太着急处理,后面收到了很多小伙伴的吐槽,也是加急修复了,现在体验应该顺滑多了。

3、好多观猹员提到希望有分支、选项、好感度、做题解锁等功能,你打算后续怎么来做?
目前最主要的是分支选项功能,这是更新的下一步方向。对于好感度等的功能,我会根据社区的反响来决定是否往这方面更新。(感觉好感度这一块不是很好做)。
另外,角色语音播放功能后面也会考虑推出。
4、很多人吐槽“没有历史记录、回退不了、只能重传”,也有人想做“系列科目”。你打算怎么设计“文档库/存档/分类/复习”的体系,让 Paper2Galgame 不只是一次性的体验?
关于没有历史记录、回退不了、只能重传的问题,现在已经解决了,现在项目已经支持游戏内的回退对话和重玩,以及在游戏结束后,可以将此次的对话剧本导出,下一次就可以直接上传导出的对话剧本,直接进入游戏。
至于文档库等等的内容,可能实现起来难度有点大,短期内就暂时不考虑了。
5、有观猹员会觉得,产品对复杂论文(涌现、思维链这种)做不到专业解读,更多是情绪陪伴,你是怎么界定 Paper2Galgame 能力边界的?
即使是地表最强模型,在处理前沿复杂论文时确实存在幻觉或理解偏差,这是行业共性。但 Paper2Galgame 的核心定位不是‘替代专家’,而是‘认知破冰’。
面对复杂概念,Galgame 的对话机制强制模型将长逻辑拆解为短交互,这实际上利用了思维链原理提升了模型的表现。
此时,情绪陪伴不再是花瓶,而是对抗阅读枯燥感的功能性设计。
只要能让用户在轻松的氛围中理解论文 60% 的核心逻辑,并坚持读完,这个产品的使命就达成了。
6、有观猹员说未来 Paper2Galgame 应用场景不止科研阅读,研报、项目文档都很适合。你怎么看待这个观点?接下来最想打穿哪个“非论文场景”?为什么?

我非常认同这个观点。Paper2Galgame 的底层逻辑并非单纯的论文翻译,而是高密度信息的降维与情感化封装。人类的大脑天生更喜欢听故事而不是读说明书。
任何长文本、高认知负担、且结构化强的内容,本质上都是 Paper2Galgame 的潜在燃料。我做的是把“苦读”变成“互动”,把“枯燥的输入”变成“有反馈的对话”。
目前我打算深究下深度行业研报与财经分析,研报和论文一样,充满了专业术语、数据图表和复杂的逻辑推演,是典型的“价值极高但阅读体验极差”的文档。很多投资者、从业者迫切需要其中的信息,但往往在阅读前三页时就因枯燥而放弃。
7、在观猹的评价里,已经有人想招你去做“下一代 IP”了,你自己对未来路径是怎么想的?继续读研、独立开发、还是加入团队做更大项目?
我目前打算是先沉淀自身,加强我自己的硬实力。后面的话,可能会加入团队和大家一起做出更好更大更强的项目吧。


,群里的独立开发者是女生,群成员也是女生,在群里会分享女生会用到的一些app,后续也会邀请更多女生独立开发者进来分享, 加我好友,可以邀请你进群。

