文章来源:智汇AI 发布时间:2025-07-28
在AI图像与视频生成领域,MidJourney虽声名远扬,但高成本与封闭生态让不少人却步。如今,Openjourney 横空出世,它不仅界面模仿MidJourney,更深度整合Google Gemi…
暂无访问在AI图像和视频生成领域,MidJourney一直是备受瞩目的明星工具,但高昂的使用成本和相对封闭的生态,让不少用户望而却步。不过,最近有个叫Openjourney的项目横空出世,给开源社区带来了新的希望,它就像一颗投入平静湖面的石子,激起了层层涟漪。
Openjourney是由@ammaar精心打造的创新项目。它在界面设计上巧妙地模仿了MidJourney,经典的四宫格布局让人一眼就有熟悉感。但Openjourney可不止是简单的模仿,在技术核心层面,它深度整合了GoogleGeminiSDK,还集成了强大的Imagen4和Veo2/3模型,为用户提供了一站式的AI图像和视频生成解决方案。这就好比在一个熟悉的框架里,装上了更强大的引擎,让用户既能享受熟悉的操作体验,又能获得更出色的生成效果。
体验地址:https://github.com/ammaarreshi/openjourney
Openjourney充分利用Imagen4模型的强大能力,用户只需输入文字描述,就能轻松生成四张1024x1024像素的高清图片。这四张图片以直观的四宫格形式展示,就像打开了一个装满创意的宝盒。而且,生成的图片可以直接下载保存,还能放大查看细节,甚至能一键转换为视频,满足用户在不同场景下的需求。比如,设计师在寻找灵感时,输入几个关键词,就能快速得到多张高清图片,大大提高了工作效率。
在视频生成方面,Openjourney同样表现出色。通过Veo3模型,用户输入文字描述,就能生成一段带音频的3-5秒720p短视频。想象一下,你想制作一个简单的产品宣传视频,输入产品特点和宣传语,就能快速得到一个有声音、有画面的短视频,是不是很方便?
除了动态视频生成,Veo2模型还能让静态图片“动起来”。用户选择一张图片,添加文字描述,就能将其转化为动画视频。视频内容以2x2网格形式展示,鼠标悬停即可自动播放,交互性极强。这种动静结合的视频生成方式,为用户提供了更多的创意空间。
Openjourney在用户体验方面也下足了功夫。它的输入框简洁直观,就像一个友好的小助手,等待用户输入提示词。用户输入内容后,点击“生成”或按下回车,就能开启创意之旅。平台支持全屏查看和下载作品,用户可以通过箭头键方便地翻阅生成历史,就像翻看一本精美的相册。
界面的流畅动画效果得益于FramerMotion,加载时的“骨架屏”占位设计,不仅提升了专业感,还让用户在等待过程中不会感到枯燥。这些细节之处,都体现了开发者对用户体验的重视。
对于开发者来说,Openjourney的技术栈也非常有吸引力。它采用Next.js15(包含AppRouter和Turbopack)作为前端框架,确保了出色的性能和开发体验;使用TypeScript提升了代码的可靠性;基于TailwindCSSv4快速构建美观界面;利用FramerMotion实现流畅的交互效果;并整合了ShadCN和RadixUI保证界面的美观性和无障碍标准。其核心AI能力通过GoogleGeminiSDK调用Imagen4和Veo2/3模型来实现图像和视频生成。这样现代且robust的技术栈,非常适合开发者学习和二次开发。
Openjourney的发布,为开源社区带来了MidJourney的一个强大且充满潜力的替代方案。它展示了GoogleAI技术在创意应用领域的广阔前景,也让更多用户能够轻松利用AI生成高质量的图像和视频。
相关工具地址:
体验地址:Midjourney网页版官网入口体验地址:谷歌gemini网页版官网地址体验地址:谷歌Veo视频模型官网地址相信在未来,Openjourney会不断发展和完善,为用户带来更多的惊喜。