Módulo responsável por lidar com o gerenciamento das interações entre o Agente e o usuário, permitindo acompanhar o custo por pergunta e o custo total em períodos específicos, facilitando a gestão do orçamento e permitindo ajustes estratégicos no uso dos recursos de IA para manter a operação eficiente e dentro do planejamento financeiro.
Elemento | Descrição |
---|---|
Traços | Total de interações rastreadas no sistema, como chamadas ou logs processados pelo modelo. Cada interação pode estar vinculada a um usuário ou evento específico. |
Custos de modelos | Custo total acumulado pelo uso do modelo, baseado nos tokens processados. Geralmente expresso em dólares (USD). |
Tokens | Quantidade total de tokens processados, representando unidades de texto nas interações, como palavras ou fragmentos. |
Pontuações | Métrica de avaliação da qualidade das respostas do modelo, podendo ser gerada automaticamente ou preenchida manualmente. |
Latências de traços | Tempo médio e percentis (50º, 90º, 95º, 99º) para o processamento de cada traço, refletindo a velocidade do sistema ao lidar com interações. |
Latências de gerações | Tempo necessário para que o modelo gere respostas, com análise de percentis para avaliar o desempenho. |
Latências de modelos | Tempo médio de resposta global do modelo, segmentado por percentis para medir sua eficiência. |
Consumo por usuário | Análise detalhada do custo individual de tokens e do número de traços por usuário, permitindo mensurar o impacto de cada interação. |
Traços
Gerações
Pontuações