Observamos que estudantes e educadores estão utilizando ativamente diversos mecanismos e ferramentas para a criação de conteúdo, incluindo ferramentas baseadas em inteligência artificial.
As ferramentas de IA tornaram-se parte do processo educacional, apesar de serem uma inovação recente. Alunos e professores as utilizam porque são extremamente eficientes, rápidas e oferecem acesso a uma grande quantidade de informações. No entanto, o uso dessas ferramentas também envolve certos riscos.
Nossa empresa decidiu criar um módulo que atendesse às necessidades de instituições educacionais, organizações e editoras. Uma instituição de ensino, ao dispor de uma ferramenta eficaz para combater abusos que possam surgir com o uso do ChatGPT, Bard e outras ferramentas de IA, poderá proteger melhor os estudantes contra violações dos princípios de integridade acadêmica e preservar os padrões de qualidade da educação.
O relatório de conteúdo gerado por IA é incorporado ao relatório interativo de similaridade, o que torna a análise muito mais prática. Também é conveniente avaliar o documento com base em dois critérios ao mesmo tempo e deixar comentários relacionados tanto à IA quanto ao plágio.
Ao clicar em “Detalhes” na seção de Busca de Conteúdo de IA, é possível abrir o segundo relatório.
Nosso relatório rastreia tanto a razão de probabilidade de IA quanto a probabilidade de IA para cada fragmento de texto por meio da coloração dos fragmentos. Cada cor representa a probabilidade de o texto ter sido escrito por uma IA ou por um humano. O relatório exibe uma lista de fragmentos e o Coeficiente de Probabilidade de IA para cada um deles.
Se o texto estiver em verde, a probabilidade de ter sido escrito por uma máquina é mínima; se estiver em vermelho, a probabilidade é máxima.
Essas cores não podem ser alteradas manualmente, nem aceitas ou rejeitadas. A probabilidade de que o texto tenha sido escrito por uma IA é verificada por módulos e algoritmos que atualmente representam o estado da arte.
StrikePlagiarism.com detecta conteúdo gerado por IA em mais de 100 idiomas, incluindo inglês, chinês (mandarim), hindi, espanhol, francês, árabe, português, indonésio (bahasa), urdu, alemão, vietnamita, filipino (tagalo), malaio, tâmil, italiano, khmer, polonês, neerlandês, romeno, grego, húngaro, tcheco, sueco, dinamarquês, eslovaco, norueguês, finlandês, lituano, estoniano, etc., garantindo precisão analítica sem igual e mantendo a integridade acadêmica.
O módulo aplica aprendizado supervisionado utilizando vários modelos, incluindo uma versão modificada do modelo BERT, para prever se o conteúdo é artificial ou original. A inteligência artificial foi exposta a milhões de textos, tanto gerados por IA quanto escritos por humanos, sendo então treinada para identificar a diferença entre eles. Após cada sessão de treinamento, um grande conjunto de dados de teste é utilizado para avaliar se o novo modelo representa uma melhoria.
Análise linguística
Como o conteúdo criado por IA é gerado com base em padrões, não é surpreendente que nele se percebam frases repetitivas, sintaxe estranha ou a ausência de nuances típicas da escrita humana.
Análise estatística
Muitas plataformas utilizam modelos estatísticos para avaliar a complexidade do texto, a estrutura das frases e o uso do vocabulário para determinar se o texto foi escrito por uma IA. Textos gerados por IA frequentemente apresentam uma estrutura e comprimento de frases uniformes, o que os distingue da escrita humana.
Modelos de aprendizado de máquina
Modelos de aprendizado de máquina (como o Originality.AI) são treinados para diferenciar textos humanos dos gerados por IA. Eles utilizam diversas características do texto, incluindo os métodos mencionados acima, para aprender a identificar traços típicos que indicam a escrita por IA.
O módulo tem uma precisão de mais de 94% em identificar textos gerados pelo GPT-3, GPT-3.5, GPT-4, GPT-Plus, GPT-Search e ChatGPT. No entanto, ele não é perfeito, e erros são sempre possíveis.
É muito melhor, mais correto e seguro analisar uma série de documentos do autor do que tomar uma decisão com base em um único documento.
O comprimento do documento importa – quanto mais longo o documento, mais preciso será o resultado. O valor recomendável para o Coeficiente de Probabilidade de IA (CPI) é superior a 60%. Se o CPI estiver acima de 80% e o SC estiver abaixo de 20%, o trabalho deve ser analisado cuidadosamente.