Recraft , une société de San Francisco développant l’intelligence artificielle pour la création d’images avec un œil spécifique vers la cohérence de la marque, a obtenu 30 millions de dollars dans le financement de la série B, la société annoncé sur le 6 mai . Le tour d’investissement a été dirigé par Accel et a vu la participation des bailleurs de fonds existants Khosla Ventures et Madrona, ainsi que de nouveaux investisseurs Nat Friedman, Elad Gil et RTP Global.
Cette perfusion de capital, qui coïncidait avec le recrude de la «création de style avancé et des contrôles» pour sa plate-forme, construit sur une série de 12 millions de dollars dans 2024. a franchi la barre des 5 millions de dollars, sa base d’utilisateurs s’étendant à 4 millions.
La technologie de l’entreprise, alimentée par son modèle «Recraft V3» propriétaire, a fait des vagues fin 2024. Selon un , ce modèle a obtenu la position supérieure sur le classement du modèle de texte à l’image de Hugging Face par analyse artificielle avec une note ELO de 1172, surpassant les noms établis comme Dall-E d’Openai et MidJourney.
Recraft emphasizes that its models are developed in-house and are engineered to provide precise control over the placement and appearance of visual elements, including accurate logo integration and adherence to brand-specific style guides – capabilities often sought after by Les équipes de marketing et de conception.
Recraft V3 est décrite par l’entreprise comme un «modèle premier de son genre offrant une génération d’images de toute taille ou de toute longueur de texte, et un contrôle précis sur le placement et l’apparence d’éléments visuels». La société a également affirmé dans son annonce d’octobre 2024 selon laquelle «Recraft V3 est le seul modèle au monde qui peut générer des images avec de longs textes, par opposition à un seul ou à quelques mots. Microsoft, et est crédité comme le créator de la bibliothèque catboost . Avant sa carrière technologique, Dorogush a travaillé comme modèle professionnel tout en obtenant un diplôme en mathématiques et en informatique dans une université russe de haut niveau.
Elle a dit à TechCrunch que cette expérience antérieure a façonné son approche pour construire l’entreprise: «La plus grande leçon de ce moment était que le broyage n’était pas tout”,”Dorogush a déclaré à TechCrunch.”Maintenant, lors de la création d’une entreprise, je sais que pour réussir, nous devons être excellents dans ce qui est critique. Dans notre cas, la construction de modèles est très importante. Nous avons donc mis tous les efforts dans l’excellent.”
Les investisseurs ont fait écho à la confiance dans l’approche ciblée de Recraft. Zhenya Loginov, associée chez Accel, a déclaré: «Anna et l’équipe Recraft comblent l’écart entre la créativité et la cohérence pour les professionnels de la conception qui doivent se déplacer rapidement, la conception à grande échelle et ne peuvent pas se permettre de faire des compromis sur le contrôle.”
Accélé href=”http://www.accel.com/noteworthies/the-future-of-professional-ai-enabled-design-our-investment-in-recraft”Target=”_ Blank”> Annonce de l’investissement a mis en évidence le besoin d’outils AI professionnels pour offrir non seulement la puissance de la création mais aussi le”contrôle fin,”L’entreprise a également souligné que «l’augmentation de 700% de l’adoption des utilisateurs de Recraft au cours de la dernière année seulement», et a noté que ses outils sont utilisés par des équipes d’organisations comme Amazon, Nvidia, Salesforce et Uber. Recraft propose également une API qui, selon la société, est utilisée par les entreprises qui doivent générer des volumes élevés d’images pour la publicité, le marketing ou d’autres applications.
L’arène encombrée de la génération d’images AI
Recraft se concentre sur la conception et les fonctionnalités de la génération d’images Vector, de la génération d’exportation, SVG, PNG, JPG, ou LoTie) et Dethed in SVG, PNG, JPG, ou LoTie) et Dethed in Svg, PNG, JPG, ou LoTie) et Detwory in Svg, PNG, JPG, ou LoTie) et Exportable In SVG, PNG, JPG, OR LOTIE) et Détails dans SVG, PNG, JPG, ou LoTie) et Detwory In Syle Le contrôle le positionne dans un domaine hautement compétitif. Cela inclut non seulement les services de génération d’images AI directs comme MidJourney, Adobe Firefly, STABLE Diffusion et Black Forest Labs, mais également des plateformes de conception plus larges telles que Canva, qui a elle-même la génération d’images AI intégrée et est un adoptant précoce de l’espace d’image d’OpenAI par l’iT-Image-1 API. OpenAI a créé son modèle d’image basé sur GPT-4O, «GPT-IMAGE-1», disponible pour les développeurs via une API le 24 avril. Cela permet la création d’images programmatiques et l’édition, avec OpenAI garantissant que les données soumises par l’API ne sont pas utilisées pour la formation de modèle.
Le service est prix par jeton, traduisant à peu près 2 à 19 cents par image. Plus tôt, fin mars 2025, Openai avait intégré ces outils de génération d’images directement dans Chatgpt. Selon OpenAI, «4O Image Generation est une nouvelle approche de génération d’images beaucoup plus capable que notre précédente série de modèles Dall · E 3. Augmentation des besoins de calcul.
En attendant, les services plus récents se disputent également la part de marché. Reve Image 1.0, lancé le 26 mars, est en concurrence sur l’abordabilité, offrant 500 images pour 5 $ et vantant des capacités de rendu de texte solides.
ByTedance a introduit son modèle Seedream 3.0 et son outil de texage de graines le 19 avril, ciblant les utilisateurs mondiaux et la technique de la génération de textes de la photoréalisme et de l’industrie 94% pour les caractères chinois et l’anglais.”Nuances
dans le secteur, la lutte contre l’origine et l’utilisation éthique du contenu généré par l’IA restent une considération clé. Openai, par exemple, intégre les métadonnées C2PA (Coalition for Content Provenance and Authenticity) dans les images de son API GPT-IMAGE-1 pour les désigner comme Généré, une norme qu’il a soutenue depuis le début de 2024 avec Dall · E 3 et encore engagé par Rejoignant le comité de pilotage C2PA en mai 2024 .
La société déclare également qu’il évite d’imiter les styles des artistes vivants. Ces mesures s’alignent sur les discussions plus larges de l’industrie et les efforts législatifs, tels que le projet de loi AB 3211 de Californie, qui propose l’étiquetage obligatoire de contenu d’IA.
Alors que Recraft V3 est promu pour sa capacité à générer des images avec un texte long et à offrir un contrôle précis. Son API GPT-IMAGE-1, et les invites complexes de traitement peuvent prendre jusqu’à deux minutes.
L’équilibre entre la qualité de l’image, la vitesse de génération, le coût et le niveau de contrôle des utilisateurs sur la sortie continue d’être un facteur déterminant dans ce marché en évolution, les ressources de calcul requises par ces modèles puissants étant également une considération de fond pour leur adoption largement répandue et le pas de pas.