Сон искусственного разума
Mar. 14th, 2026 09:25 amЗагадочная для меня проблема всяких ИИ: надписи в картинках. Вывески там, знаки всякие и так далее. Там с самого начала и до сих пор получается всякая абракадабра и гобблдигук вместо нормальных надписей. Сейчас чуть получше, но все равно. Казалось бы, это как раз то, что искусственный интеллект умеет лучше всего - слова писать. Картинки рисовать тоже умеет. Очевидно, для ИИ есть существенная разница между созданием текста в компьютерном смысле и письмом в традиционном понимании, где каждую букву надо было выводить каким-нибудь стилом. Ну и возникают проблемы известного типа "Я уже букву К нарисовал". Наверно, просто никому не приходило в голову их отдельно тренировать это делать. Ну или у них там дико узкая специализация: кто умеет писать, рисовать не умеет, и наоборот. С другой стороны, прогресс все-таки есть. Заголовок вот тут уже вполне человеческий, например.

Остальное тоже неплохо и даже креативно. "Ну и захеж мы купыии слолко едя?" О чем речь, понятно, и новые слова тоже в тему. "Захеж", если приложить некоторые усилия, может даже пойти в народ.
(Это я увидел у кого-то в Фейсбуке только что. К сожалению, пока сохранял картинку, долбаный Фейсбук выдал свежую порцию постов, а старая пропала, как там заведено. А я не помню, кто это был. Если кто в курсе, подскажите, чтобы я ссылку поставил.)
Пойду потребую у нанобананы какую-нибудь каллиграфию и посмотрю, что получится.
UPD: посмотрел. Попросил нанобанану сделать картинку с текстом, написанным каролингским минускулом.

Текст был воспроизведен из промпта почти безукоризненно - в первой строке ошибка, вызванная, видимо, моим требованием сделать инициал. Шрифт к каролингскому минускулу относительно близок, хотя рукописным не выглядит (но это уже совсем другая история). Возможно, объяснение загадочным надписям надо искать или в бесплатной природе тех мест, где их делали, или в проблемах с промптами.

Остальное тоже неплохо и даже креативно. "Ну и захеж мы купыии слолко едя?" О чем речь, понятно, и новые слова тоже в тему. "Захеж", если приложить некоторые усилия, может даже пойти в народ.
(Это я увидел у кого-то в Фейсбуке только что. К сожалению, пока сохранял картинку, долбаный Фейсбук выдал свежую порцию постов, а старая пропала, как там заведено. А я не помню, кто это был. Если кто в курсе, подскажите, чтобы я ссылку поставил.)
Пойду потребую у нанобананы какую-нибудь каллиграфию и посмотрю, что получится.
UPD: посмотрел. Попросил нанобанану сделать картинку с текстом, написанным каролингским минускулом.

Текст был воспроизведен из промпта почти безукоризненно - в первой строке ошибка, вызванная, видимо, моим требованием сделать инициал. Шрифт к каролингскому минускулу относительно близок, хотя рукописным не выглядит (но это уже совсем другая история). Возможно, объяснение загадочным надписям надо искать или в бесплатной природе тех мест, где их делали, или в проблемах с промптами.

no subject
Date: 2026-03-14 03:39 pm (UTC)no subject
Date: 2026-03-14 04:04 pm (UTC)no subject
Date: 2026-03-14 10:51 pm (UTC)no subject
Date: 2026-03-14 03:50 pm (UTC)Известный эффект.
no subject
Date: 2026-03-14 03:55 pm (UTC)no subject
Date: 2026-03-14 10:35 pm (UTC)no subject
Date: 2026-03-14 10:36 pm (UTC)no subject
Date: 2026-03-14 10:49 pm (UTC)занятно, кажется, этот странный эффект можно усовершенствовать буквально тремя-четырьмя командами при обучении, объединив некоторые слои его слоистой "памяти". видимо, никому не нужно это специально - ну, или там есть неведомые нам технические сложности, например, разные принципы формирования соотв. ассоциативных слоев для видео-, аудио- и текстовой информации.
"Захеж", ... может даже пойти в народ
Date: 2026-03-14 04:33 pm (UTC)"Десятей салатов" тоже хорошо заходит.
Re: "Захеж", ... может даже пойти в народ
Date: 2026-03-14 05:06 pm (UTC)Re: "Захеж", ... может даже пойти в народ
Date: 2026-03-14 05:59 pm (UTC)Re: "Захеж", ... может даже пойти в народ
Date: 2026-03-14 07:31 pm (UTC)Re: "Захеж", ... может даже пойти в народ
Date: 2026-03-14 07:39 pm (UTC)Лично я воспринял "захеж" как сокращенное "за каким же хером". Если ставить ударение на второй слог, это теряется.
Re: "Захеж", ... может даже пойти в народ
Date: 2026-03-14 10:26 pm (UTC)Но нам-то, спрашивается, какое дело до происхождения термина? Мне тоже ударение на первый слог, пожалуй, больше нравится.
no subject
Date: 2026-03-14 05:40 pm (UTC)no subject
Date: 2026-03-14 05:42 pm (UTC)no subject
Date: 2026-03-14 06:33 pm (UTC)no subject
Date: 2026-03-14 07:35 pm (UTC)no subject
Date: 2026-03-14 07:40 pm (UTC)no subject
Date: 2026-03-14 08:35 pm (UTC)no subject
Date: 2026-03-14 09:04 pm (UTC)no subject
Date: 2026-03-14 07:52 pm (UTC)no subject
Date: 2026-03-14 07:58 pm (UTC)no subject
Date: 2026-03-14 09:14 pm (UTC)no subject
Date: 2026-03-14 10:33 pm (UTC)поскольку таких надписей на картинках на три-четыре порядка (как минимум) меньше, чем просто текстов - через некоторое время он будет писать такие надписи на приемлемом уровне. и это будет тогда, когда тексты он научится генерировать на уровне, недоступном при обычном владении языком - т.е. через год-полтора, видимо.
no subject
Date: 2026-03-14 10:35 pm (UTC)no subject
Date: 2026-03-14 10:46 pm (UTC)за последний год оно научилось писать пресс-релизы лучше 50% пресс-секретарей стран G7. год назад представить себе было невозможно такой прогресс.
ну и окна для токенов стали просто огромные. сейчас в них нормально влезает среднего размера книга. это уже более или менее хорошо. когда контекстное окно будет размером с областную библиотеку, это уже будет очень много. сейчас специалист-гуманитарий оперирует в конкретной теме, я думаю, 25-30 текстами размера книги в течение нескольких месяцев. если эта штука ему расширит окно до 300 - это будет совсем другое дело, ибо рядовой человек такое не в состоянии делать, это для него подвиг.
думаю, через полгода-год надо будет это все нормально осваивать. оно точно перестало быть игрушкой для амбициозных переростков, это правда. инструментарий к этой штуке сильно отстает от ее возможностей.
no subject
Date: 2026-03-14 11:00 pm (UTC)no subject
Date: 2026-03-14 11:35 pm (UTC)это другая проблема. бог весть, что ему нужно тогда. возможно, он действительно пытается понять из набора существующих у него в "предпамяти" картинок, как это может выглядеть - и портит текст, исходя из усредненного качества надписей на этих картинках.
no subject
Date: 2026-03-14 11:37 pm (UTC)буквы-то он может отрисовывать по картинке - перевод шрифта в символы явно не двусторонний процесс. но тут он слова подбирает.
no subject
Date: 2026-03-14 11:55 pm (UTC)no subject
Date: 2026-03-15 12:51 am (UTC)мы с приятелем в НИИ
проектируем ИИ
как чего не генерируй
получаются хуи
пока что, в общем, далеко от сингулярности. но движение есть.
no subject
Date: 2026-03-14 11:53 pm (UTC)no subject
Date: 2026-03-15 03:53 am (UTC)