Ми помітили, що студенти та викладачі активно використовують різні механізми та інструменти для створення контенту, зокрема інструменти штучного інтелекту (ШІ).
Інструменти ШІ стали частиною освітнього процесу, хоча вони з'явилися зовсім недавно. Студенти та викладачі використовують їх через високу ефективність, швидкість роботи та доступ до значних обсягів інформації. Однак використання ШІ несе певні ризики.
Наша компанія вирішила створити модуль, який відповідатиме потребам освітніх закладів, організацій і видавництв. Освітня установа, маючи ефективний інструмент для протидії зловживанням, які можуть виникати при використанні ChatGPT, Bard та інших ШІ-інструментів, зможе краще захищати студентів від порушення принципів академічної доброчесності та зберігати стандарти якості освіти.
Звіт про контент ШІ інтегрований у інтерактивний звіт про подібність, що дозволяє зручно аналізувати матеріал. Також можна оцінювати документ одразу за двома критеріями та залишати коментарі як щодо ШІ-контенту, так і щодо плагіату.
Натиснувши на "Деталі" в розділі Пошук контенту ШІ, ви зможете відкрити додатковий звіт.
Наш звіт відображає коефіцієнт ймовірності ШІ як для всього тексту, так і для окремих його фрагментів за допомогою кольорового маркування. Кожен колір вказує на ймовірність того, що текст написаний ШІ або людиною. У звіті відображено список фрагментів із відповідним коефіцієнтом ймовірності ШІ.
Якщо текст забарвлений у зелений колір, імовірність того, що він згенерований ШІ, мінімальна. Якщо червоний – імовірність максимальна.
Ці кольори не можуть бути змінені вручну, підтверджені чи відхилені. Імовірність створення тексту ШІ перевіряється найкращими на цей момент алгоритмами та модулями.
StrikePlagiarism.com виявляє контент, створений штучним інтелектом, понад 100 мовами, серед яких українська, англійська, китайська, хінді, іспанська, французька, арабська, португальська, індонезійськ, урду, німецька, в’єтнамська, філіппінська, малайська, тамільська, італійська, кхмерська, польська, нідерландська, румунська, грецька, угорська, чеська, шведська, данська, словацька, норвезька, фінська, литовська, естонська та інші, забезпечуючи неперевершену точність аналізу та підтримуючи академічну доброчесність.
Модуль використовує контрольоване навчання за допомогою кількох моделей, зокрема модифікованої моделі BERT, для передбачення, чи є контент штучним або оригінальним.
Штучному інтелекту було представлено мільйони текстів, як ШІ-генерованих, так і людських, після чого він був навчений розрізняти їх. Після кожного навчання великий набір тестових даних використовується для оцінки того, чи є нова модель покращеною.
Лінгвістичний аналіз
Оскільки контент, створений ШІ, генерується за шаблонами, у ньому часто можна помітити повторювані фрази, дивний синтаксис або відсутність нюансів, характерних для людського письма.
Статистичний аналіз
Багато платформ використовують статистичні моделі для оцінки складності тексту, структури речень та використання лексики з метою визначення, чи був текст написаний ШІ.
Тексти, створені ШІ, часто мають рівномірну структуру та довжину речень, що відрізняє їх від людського письма.
Моделі машинного навчання
Моделі машинного навчання (наприклад, Originality.AI) навчені розрізняти людські та ШІ-тексти.
Вони використовують різні характеристики тексту, зокрема згадані вище методи, для виявлення характерних ознак, які вказують на ШІ-генерацію.
Точність модуля у визначенні тексту, згенерованого GPT-3, GPT-3.5, GPT-4.0, GPT-Plus, GPT-Search та ChatGPT, становить понад 94%. Однак він не ідеальний, і можливі похибки.
Набагато коректніше та безпечніше аналізувати серію документів одного автора, ніж приймати рішення на основі одного документа.
Довжина документа має значення – що довший документ, то точніший результат.
Рекомендоване значення коефіцієнта ймовірності ШІ – понад 60%.
Якщо коефіцієнт ймовірності ШІ перевищує 80%, а коефіцієнт подібності менший за 20%, документ слід ретельно проаналізувати.