Новости

RSS-трансляция Читать в ВКонтакте Читать в Одноклассниках Наш канал в Яндекс Дзен




2.07.2024 23:38
721
Экзаменационные работы, созданные ИИ, в 94% невозможно отличить от написанных студентами

Исследование показало, что обнаружить студенческие экзаменационные работы, созданные с помощью искусственного интеллекта, практически невозможно. Почти все заявки, подготовленные с помощью искусственного интеллекта (ИИ), остались незамеченными в ходе недавнего тестирования экзаменационных систем британских университетов.

Исследователи из Университета Рединга обнаружили, что статьи, созданные ИИ, в среднем получили более высокие оценки по сравнению с работами, написанными настоящими студентами. Они опубликовали свои выводы в журнале открытого доступа PLOS ONE.

Искусственный интеллект уже доказал, что может сдавать экзамены, из-за чего некоторые школы и университеты запретили студентам использовать доступные инструменты ИИ, такие как ChatGPT. Однако, согласно новому исследованию, применение этого правила оказалось сложной задачей.

Исследователи представили написанные ИИ экзамены по пяти различным курсам для получения степени бакалавра по психологии в университете. Они обнаружили, что 94 процента этих заявок остались незамеченными в ходе так называемого исследования «теста Тьюринга». Названный в честь британского математика и ученого-компьютерщика Алана Тьюринга в 1950 году, этот показатель измеряет способность машины демонстрировать разумное поведение, сходное с поведением человека.

Авторы заявили, что результаты исследования «крайне тревожны», особенно с учетом того, что «содержание ответов, сгенерированных ИИ», не было изменено исследователями.

«В целом наш показатель обнаружения в 6 процентов, вероятно, переоценивает нашу способность обнаруживать реальное использование ИИ для списывания на экзаменах», — отметили они в исследовании, добавив, что было бы более правдоподобно, если бы студенты модифицировали выходные данные ИИ, чтобы сделать их менее обнаруживаемыми.

Более того, в 83,4% случаев работы, сгенерированные ИИ, получили более высокие оценки по сравнению со случайно выбранной группой из того же количества экзаменов, сданных реальными студентами.

Единственным исключением стал модуль, в котором требовалось больше абстрактных рассуждений, с которыми ИИ справляется с трудом по сравнению с реальными студентами.

«Результаты «Экзаменационного теста Тьюринга» призывают мировой сектор образования принять новую норму, и это именно то, что мы делаем в Университете Рединга, — говорится в заявлении авторов исследования. - Новые правила и рекомендации для наших сотрудников и студентов учитывают как риски, так и возможности, предоставляемые инструментами, использующими искусственный интеллект», — добавили они.

В свете этих результатов исследователи выразили обеспокоенность по поводу академической честности и предположили, что контролируемые очные экзамены могли бы смягчить эту проблему.

Однако, поскольку инструменты ИИ продолжают развиваться и становятся все более распространенными в профессиональной среде, университетам, возможно, придется изучить способы интеграции ИИ в образование как часть «новой нормы».

Понравилась эта новость? Подпишись на нас в соцсетях!