Skip to main content
POST
/
api
/
v2
/
extractor
/
web-scraper
Importar conteúdo web
curl --request POST \
  --url https://chat.api.toolzz.com.br/api/v2/extractor/web-scraper \
  --header 'Content-Type: application/json' \
  --data '
{
  "unityId": "<string>",
  "datasetId": "<string>",
  "url": "<string>",
  "limit": 123
}
'
{
  "message": "<string>",
  "content": "<string>",
  "url": "<string>",
  "urls": {
    "key": "<string>",
    "value": "<string>"
  }
}

Descrição da requisição

Alguns sites poderão ser bloqueados e a não poderão ser usados para treinamento.
unityId
uuid
required
Identificador único da unidade associada à base de conhecimento.
datasetId
uuid
required
Identificador do dataset onde o conteúdo será armazenado.
url
string
required
URL da página que será processada e importada para o dataset.
limit
number
Limite máximo de páginas ou conteúdos que serão processados a partir da URL informada.

Descrição da Resposta

Abaixo você verá a descrição da resposta da requisição após a importação de conteúdo web
message
string
required
Mensagem indicando o resultado do upload do conteúdo web.
content
string
Conteúdo textual extraído da página web processada. Esse conteúdo pode incluir texto formatado, links e imagens presentes na página original.
url
string
required
URL principal que foi processada e utilizada para gerar o conteúdo.
urls
object
Lista de URLs identificadas dentro do conteúdo processado.

Segurança

Para acessar este endpoint, é necessário enviar um token de acesso válido através do cabeçalho de autorização (Authorization) da requisição. Além disso, a API é protegida por outras medidas de segurança para proteger os dados dos usuários.