Мониторинг доступности, производительности и возможностей моделей
| Модель | Health Score | Статус | Задержка | Streaming | Functions | Long Context |
|---|
Health Score — это комплексный индикатор здоровья модели (0-100 баллов), рассчитанный на основе:
Категории:
Отправляем минимальный запрос "Hi" с ограничением в 5 токенов и измеряем:
Штрафы Health Score:
Отправляем запрос "Count to 3" с параметром stream=True и проверяем:
Результаты: ✓ (работает), ✗ (не поддерживается), ? (неизвестно)
Штраф: -10 баллов Health Score если не поддерживается
Отправляем запрос "What time is it in Moscow?" с функцией get_current_time
и проверяем:
tool_callstools, но не вызвала функциюtoolsШтрафы Health Score:
Отправляем промпт с ~10,000 токенов текста и командой суммировать в 3 слова:
Также измеряем latency обработки длинного контекста — критично для RAG и работы с документами.
Штраф: -15 баллов Health Score если не поддерживается
При недоступности модели все capability-проверки пропускаются (N/A).
Выбор модели для production:
Оптимизация затрат: