Заспорили со знакомым о том, какие навыки вашей профессии искусственный интеллект перенять может, а какие - никада. Мимоходом обнаружил задачу, которую с удовольствием передоверил бы роботу, потому что уверен, что он справится не хуже, если не лучше меня. Искать в текстах цитаты и аллюзии. То есть понятно, что само по себе это творческая работа и часть увлекательной игры, имя которой - искусство перевода, и полностью отдавать ее роботу я не готов просто потому, что я такое и сам люблю, но вот под конец запустить программку и выловить в романе пару-тройку провороненных цитат из Шекспира (которого я, честно скажем, читал не так, чтобы всего, и уж точно не в оригинале) - милое же дело.
Page Summary
tal-gilas.livejournal.com - (no subject)
livelight - (no subject)
old-greeb.livejournal.com - (no subject)
snk1965.livejournal.com - (no subject)
ikadell.livejournal.com - (no subject)
slobin.livejournal.com - (no subject)
spamsink - (no subject)
kdm17.livejournal.com - (no subject)
lu-crecia.livejournal.com - (no subject)
Style Credit
- Style: Green Machine for Lefty by
Expand Cut Tags
No cut tags
no subject
Date: 2022-09-23 07:36 am (UTC)Ну, тут ведь как. Автор может цитировать неточно (потому что память не эльфийская). Автор может цитировать намеренно неточно. Автор может цитировать по изданию, отличающемся от того, которое впоследствии стало более или менее каноническим. И конкретно это, боюсь, никакой ИИ не отследит, потому что заточен он будет на поиск точных цитат, а не цитат, в которых произвольно изменено два-три слова, еще одно пропущено или переставлено... ну и т.д.
no subject
Date: 2022-09-23 09:27 am (UTC)Не, ну гугл поиск же справляется как-то. Цитаты по памяти я в половине случаев найти могу — а в той, в которой не могу, не могу потому, что ищет он не только по корпусу художественной литературы:), а мысль оказывается популярной в публицистике.
Недавно я например пытался опознать цитату из Онегина, которую сначала перевели на китайский, а потом на английский. Искал по ключевым словам по тексту, ИИ бы думаю справился не хуже при правильно созданном алгоритме.
no subject
Date: 2022-09-24 05:05 pm (UTC)no subject
Date: 2022-09-23 11:00 am (UTC)поэтому kot-kam и написал, что сначала надо сделать основную работу вручную.
no subject
Date: 2022-09-23 01:59 pm (UTC)Насколько я понимаю, это все как раз решаемо. Робот может, например, отслеживать все похожие слова и делать предположения — а возможно, во фразе "не мир, но мяч" имеется в виду такая-то цитата.
no subject
Date: 2022-09-23 03:02 pm (UTC)no subject
Date: 2022-09-24 08:27 am (UTC)no subject
Date: 2022-09-24 11:58 am (UTC)Именно.
no subject
Date: 2022-09-23 09:30 am (UTC)no subject
Date: 2022-09-23 09:42 am (UTC)no subject
Date: 2022-09-23 10:34 am (UTC)no subject
Date: 2022-09-23 10:40 am (UTC)Подумал, что у меня, как правило, проблема другая: мне цитаты, аллюзии и пр. мерещатся там, где сам автор ни о чем таком не думал.
no subject
Date: 2022-09-23 02:00 pm (UTC)А в задачу робота и не входит точно указать скрытую цитату. В задачу робота входит ткнуть в место, где цитата МОЖЕТ БЫТЬ, а там уж вы сами решайте.
no subject
Date: 2022-09-23 10:56 am (UTC)(А ведь есть ещё возможность создавать "кубышки в кубышках", аллюзии на цитаты и цитаты аллюзий, аллюзии на цепочки аллюзий и цитат и тому подобный п-низм.)
no subject
Date: 2022-09-23 01:20 pm (UTC)Да (Мф. 5:37, цитируется по: агитационные материалы референдума 1993 года)
... Кремлёвские баньши ...
no subject
Date: 2022-09-23 04:55 pm (UTC)Красиво сказано. Спасибо.
"Кремлёвские баньши" — шибануло аллюзией на "Заповедник гоблинов".
"– Но ведь банши умирает.
– Да, умирает, – вздохнул мистер О’Тул. – И чёрен этот день, и горек этот день для него, потому что никто не сидит с ним.
Он поднял кружку.
– Пейте, – сказал он. – Пейте до дна. Если выпить сколько нужно, может быть, станет не так плохо.
...
— Как ты себя чувствуешь? — спросил Максвелл. — Могу ли я чем-нибудь тебе помочь? Может быть, ты чего-нибудь хочешь?
— Нет, — сказал баньши. — У меня больше нет ни желаний, ни потребностей. Я почти ничего не чувствую. В том-то и дело, что я ничего не чувствую. Мы умираем не так, как вы. Это не физиологический процесс. Энергия истекает из меня, и в конце концов её не останется вовсе. Как мигающий язычок пламени, который дрожит и гаснет.
— Мне очень жаль, — сказал Максвелл. — Но может быть, разговаривая, ты ускоряешь…
— Да, немного, но мне всё равно. И я ни о чём не жалею. И ничего не оплакиваю. Я почти последний из нас. Если считать со мной, то нас всего трое, а меня считать уже не стоит. Из тысяч и тысяч нас, осталось только двое." © Клиффорд Саймак, 1968 г.
no subject
Date: 2022-09-23 12:45 pm (UTC)Народ в комментариях говорит: он не все поймает. Какая разница - он поймает ещё что-то. Или идею подкинет
no subject
Date: 2022-09-23 04:29 pm (UTC)no subject
Date: 2022-09-24 05:07 pm (UTC)Когда-то мне Винтра рассказывала на пальцах, как устроены комментарии к Книге Перемен, я её прогон не воспроизведу, но впечатлился. Этот иероглиф в момент написания книги звучал не тк, как сейчас, а как тот, который означает "тигр, затаившийся в кустах"...
no subject
Date: 2022-09-25 04:42 pm (UTC)Такие комментарии всегда очень интересно читать. У Кота я думаю найдётся что порассказать по поводу каламбуров, которые возникают при переводе, не будучи заложены автором.
no subject
Date: 2022-09-23 01:15 pm (UTC)Предлагаю аналогию: пользуешься ли ты, профессиональный переводчик, гуглёвым (или иным) ИИ переводчиком? Нет, понятно, что ты заведомо не будешь выкладывать это как готовый результат, это даже для меня ниже любой планки, но для каких-то промежуточных целей ты им пользуешься? И если эта аналогия хромает, то почему? (возможный ответ на последний вопрос: разница между локальным куском текста, который вот он, максимум несколько абзацев, и поиском по большому тексту, от книги и выше.. но вопрос тем не менее остаётся).
P.S. Как известно, у Стругацких минимум два "инопланетных" имени образованы написанием задом наперёд некого длинного слова или фразы, с лёгкими изменениями для благозвучия. Я однажды (давно уже, во времена мс-дос) заподозрил, а нет ли ещё. И написал искалку (никакого ИИ, честный анализ частот биграмм). Одно подозрительное имя она нашла (помимо тех двух). Но правда ли оно было так образовано, или случайное совпадение -- так и не знаю.
... Я, кажется, проглотил свою пищалку ...
no subject
Date: 2022-09-23 02:05 pm (UTC)Я не пользуюсь, и вот почему. У меня весь строй фразы, включая ритм и т.п., выстраивается в процессе перевода. Вот английская фраза, я говорю то же самое по-русски (при этом в русской фразе ни одного слова из оригинала может не остаться). Подстрочник, сгенеренный автоматически — для меня лишний этап, который мне тоже придется обдумывать и пропускать через себя; причем, в отличие от оригинала, это будет заведомо хуевый текст. Это все равно, что редактировать безнадежно плохой перевод: ни красоты, ни радости. Поиск цитат — это совсем другое, это чисто техническая задача, в которой робот может мне помочь там, где я сам не справился.
no subject
Date: 2022-09-23 04:24 pm (UTC)А вот аллюзии искать нужно гораздо больше ума. Те же "сделалась пурга" или "сделался буран" будут аллюзиями, а чтобы их искать, нужна целая база синонимов. Но и любое сделавшееся погодное явление будет аллюзией, а для этого уже нужна целая семантическая база.
no subject
Date: 2022-09-23 05:36 pm (UTC)Собственно, технически это и сейчас осуществимо. Программа типа антиплагиата, сравнивающая с английским корпусом. Но смысл? Цитату такой длины, чтобы робот ее опознал, вы сами опознаете и загуглите. А, допустим, реплику "A friend" никакой робот не опознает как цитату из Макбета (ну, если не настроить его так, что утонешь потом в ложных срабатываниях).
no subject
Date: 2022-09-23 06:23 pm (UTC)"Цитату такой длины, чтобы робот ее опознал, вы сами опознаете и загуглите."
Нет, не опознаю. Особенно если это не Шекспир, а, допустим, знаменитая речь какого-нибудь президента.
no subject
Date: 2022-09-23 09:11 pm (UTC)Вопрос в том, найдется ли коммерческий заказчик на такую работу, или энтузиаст, который захочет это сделать.
Это ведь не только вопрос человекочасов и квалификации, чтобы обучить такую сетку, нужно много вычислительных ресурсов.
Для программ-переводчкиов они нашлись, всякие рисовалки по описанию тоже быстро совершенствуются, т.к. денег на этом можно зашибить немерено.
А вот поиск аллюзий — задача, с одной стороны, нетривиальная, а с другой, довольно ограниченно востребованная.
В наше время довольно мало людей хотят копаться в текстах и искать в них неочеведные смыслы.