kot_kam: (Default)
[personal profile] kot_kam
Заспорили со знакомым о том, какие навыки вашей профессии искусственный интеллект перенять может, а какие - никада. Мимоходом обнаружил задачу, которую с удовольствием передоверил бы роботу, потому что уверен, что он справится не хуже, если не лучше меня. Искать в текстах цитаты и аллюзии. То есть понятно, что само по себе это творческая работа и часть увлекательной игры, имя которой - искусство перевода, и полностью отдавать ее роботу я не готов просто потому, что я такое и сам люблю, но вот под конец запустить программку и выловить в романе пару-тройку провороненных цитат из Шекспира (которого я, честно скажем, читал не так, чтобы всего, и уж точно не в оригинале) - милое же дело.

Date: 2022-09-23 07:36 am (UTC)
From: [identity profile] tal-gilas.livejournal.com

Ну, тут ведь как. Автор может цитировать неточно (потому что память не эльфийская). Автор может цитировать намеренно неточно. Автор может цитировать по изданию, отличающемся от того, которое впоследствии стало более или менее каноническим. И конкретно это, боюсь, никакой ИИ не отследит, потому что заточен он будет на поиск точных цитат, а не цитат, в которых произвольно изменено два-три слова, еще одно пропущено или переставлено... ну и т.д.

Date: 2022-09-23 09:27 am (UTC)
From: [identity profile] grachonok.livejournal.com

Не, ну гугл поиск же справляется как-то. Цитаты по памяти я в половине случаев найти могу — а в той, в которой не могу, не могу потому, что ищет он не только по корпусу художественной литературы:), а мысль оказывается популярной в публицистике.


Недавно я например пытался опознать цитату из Онегина, которую сначала перевели на китайский, а потом на английский. Искал по ключевым словам по тексту, ИИ бы думаю справился не хуже при правильно созданном алгоритме.

Date: 2022-09-24 05:05 pm (UTC)
From: [identity profile] beldmit.livejournal.com
Как-то. Периодически он по точным цитатам не находит примерно ничего

Date: 2022-09-23 11:00 am (UTC)
From: [identity profile] tan-y.livejournal.com

поэтому kot-kam и написал, что сначала надо сделать основную работу вручную.

Date: 2022-09-23 01:59 pm (UTC)
From: [identity profile] kot-kam.livejournal.com

Насколько я понимаю, это все как раз решаемо. Робот может, например, отслеживать все похожие слова и делать предположения — а возможно, во фразе "не мир, но мяч" имеется в виду такая-то цитата.

Date: 2022-09-23 03:02 pm (UTC)
livelight: (hot)
From: [personal profile] livelight
Это искажённая фраза "мир, дверь, мяч" же!!! Неужели не очевидно?!

Date: 2022-09-24 08:27 am (UTC)
From: [identity profile] masterspammer.livejournal.com
Пусть обе предложит, делов-то!

Date: 2022-09-24 11:58 am (UTC)
From: [identity profile] kot-kam.livejournal.com

Именно.

Date: 2022-09-23 09:30 am (UTC)
livelight: (serenity)
From: [personal profile] livelight
Цитаты (возможно, умышленно искажённые ради большей калом бурности) — да. Но аллюзии?..

Date: 2022-09-23 09:42 am (UTC)
From: [identity profile] old-greeb.livejournal.com
Идея хорошая, хотя будут ошибки в обе стороны. Скрытая цитата, переделанная идиома или искаженная пословица часто выдают себя чуть-чутешным изменением авторской интонации, и потому часто мне мерещились там, где их и следа не было.

Date: 2022-09-23 10:34 am (UTC)
From: [identity profile] nasse.livejournal.com
Так все равно проверять надо

Date: 2022-09-23 10:40 am (UTC)
From: [identity profile] old-greeb.livejournal.com
Само собой.
Подумал, что у меня, как правило, проблема другая: мне цитаты, аллюзии и пр. мерещатся там, где сам автор ни о чем таком не думал.

Date: 2022-09-23 02:00 pm (UTC)
From: [identity profile] kot-kam.livejournal.com

А в задачу робота и не входит точно указать скрытую цитату. В задачу робота входит ткнуть в место, где цитата МОЖЕТ БЫТЬ, а там уж вы сами решайте.

Date: 2022-09-23 10:56 am (UTC)
From: [identity profile] snk1965.livejournal.com
Интересно, а никто из п-нистов не пытался написать достаточно объёмное (и осмысленное!) произведение, полностью состоящее из "цитат и аллюзий"? Так, чтобы ни одного чисто авторского абзаца/предложения?
(А ведь есть ещё возможность создавать "кубышки в кубышках", аллюзии на цитаты и цитаты аллюзий, аллюзии на цепочки аллюзий и цитат и тому подобный п-низм.)

Date: 2022-09-23 01:20 pm (UTC)
From: [identity profile] slobin.livejournal.com

Да (Мф. 5:37, цитируется по: агитационные материалы референдума 1993 года)

... Кремлёвские баньши ...

Date: 2022-09-23 04:55 pm (UTC)
From: [identity profile] snk1965.livejournal.com
"буди же слово ваше: ей, ей: ни, ни: лишше же сею от неприязни есть." © (Мф™, 5:37)
Красиво сказано. Спасибо.

"Кремлёвские баньши" — шибануло аллюзией на "Заповедник гоблинов".

"– Но ведь банши умирает.
– Да, умирает, – вздохнул мистер О’Тул. – И чёрен этот день, и горек этот день для него, потому что никто не сидит с ним.
Он поднял кружку.
– Пейте, – сказал он. – Пейте до дна. Если выпить сколько нужно, может быть, станет не так плохо.

...
— Как ты себя чувствуешь? — спросил Максвелл. — Могу ли я чем-нибудь тебе помочь? Может быть, ты чего-нибудь хочешь?
— Нет, — сказал баньши. — У меня больше нет ни желаний, ни потребностей. Я почти ничего не чувствую. В том-то и дело, что я ничего не чувствую. Мы умираем не так, как вы. Это не физиологический процесс. Энергия истекает из меня, и в конце концов её не останется вовсе. Как мигающий язычок пламени, который дрожит и гаснет.
— Мне очень жаль, — сказал Максвелл. — Но может быть, разговаривая, ты ускоряешь…
— Да, немного, но мне всё равно. И я ни о чём не жалею. И ничего не оплакиваю. Я почти последний из нас. Если считать со мной, то нас всего трое, а меня считать уже не стоит. Из тысяч и тысяч нас, осталось только двое."
© Клиффорд Саймак, 1968 г.

Date: 2022-09-23 12:45 pm (UTC)
From: [identity profile] ikadell.livejournal.com
Отличная идея была бы.
Народ в комментариях говорит: он не все поймает. Какая разница - он поймает ещё что-то. Или идею подкинет

Date: 2022-09-23 04:29 pm (UTC)
From: [identity profile] finnian-light.livejournal.com
Вот именно. Можно подумать, что живой переводчик всё поймает.

Date: 2022-09-24 05:07 pm (UTC)
From: [identity profile] beldmit.livejournal.com
Тогда это может оказаться интереснее читать как комментарий, чем сам текст :)

Когда-то мне Винтра рассказывала на пальцах, как устроены комментарии к Книге Перемен, я её прогон не воспроизведу, но впечатлился. Этот иероглиф в момент написания книги звучал не тк, как сейчас, а как тот, который означает "тигр, затаившийся в кустах"...

Date: 2022-09-25 04:42 pm (UTC)
From: [identity profile] ikadell.livejournal.com

Такие комментарии всегда очень интересно читать. У Кота я думаю найдётся что порассказать по поводу каламбуров, которые возникают при переводе, не будучи заложены автором.

Date: 2022-09-23 01:15 pm (UTC)
From: [identity profile] slobin.livejournal.com

Предлагаю аналогию: пользуешься ли ты, профессиональный переводчик, гуглёвым (или иным) ИИ переводчиком? Нет, понятно, что ты заведомо не будешь выкладывать это как готовый результат, это даже для меня ниже любой планки, но для каких-то промежуточных целей ты им пользуешься? И если эта аналогия хромает, то почему? (возможный ответ на последний вопрос: разница между локальным куском текста, который вот он, максимум несколько абзацев, и поиском по большому тексту, от книги и выше.. но вопрос тем не менее остаётся).

P.S. Как известно, у Стругацких минимум два "инопланетных" имени образованы написанием задом наперёд некого длинного слова или фразы, с лёгкими изменениями для благозвучия. Я однажды (давно уже, во времена мс-дос) заподозрил, а нет ли ещё. И написал искалку (никакого ИИ, честный анализ частот биграмм). Одно подозрительное имя она нашла (помимо тех двух). Но правда ли оно было так образовано, или случайное совпадение -- так и не знаю.

... Я, кажется, проглотил свою пищалку ...

Date: 2022-09-23 02:05 pm (UTC)
From: [identity profile] kot-kam.livejournal.com

Я не пользуюсь, и вот почему. У меня весь строй фразы, включая ритм и т.п., выстраивается в процессе перевода. Вот английская фраза, я говорю то же самое по-русски (при этом в русской фразе ни одного слова из оригинала может не остаться). Подстрочник, сгенеренный автоматически — для меня лишний этап, который мне тоже придется обдумывать и пропускать через себя; причем, в отличие от оригинала, это будет заведомо хуевый текст. Это все равно, что редактировать безнадежно плохой перевод: ни красоты, ни радости. Поиск цитат — это совсем другое, это чисто техническая задача, в которой робот может мне помочь там, где я сам не справился.

Date: 2022-09-23 04:24 pm (UTC)
spamsink: (blessed)
From: [personal profile] spamsink
С цитатами относительно просто. Скажем "пришёл домой" — ниоткуда не цитата, потому что очень частотное, а "сделалась метель" — очевидная цитата, потому что редкое. Хотя, казалось бы, и там, и там два слова.
А вот аллюзии искать нужно гораздо больше ума. Те же "сделалась пурга" или "сделался буран" будут аллюзиями, а чтобы их искать, нужна целая база синонимов. Но и любое сделавшееся погодное явление будет аллюзией, а для этого уже нужна целая семантическая база.

Date: 2022-09-23 05:36 pm (UTC)
From: [identity profile] kdm17.livejournal.com

Собственно, технически это и сейчас осуществимо. Программа типа антиплагиата, сравнивающая с английским корпусом. Но смысл? Цитату такой длины, чтобы робот ее опознал, вы сами опознаете и загуглите. А, допустим, реплику "A friend" никакой робот не опознает как цитату из Макбета (ну, если не настроить его так, что утонешь потом в ложных срабатываниях).

Edited Date: 2022-09-23 05:37 pm (UTC)

Date: 2022-09-23 06:23 pm (UTC)
From: [identity profile] kot-kam.livejournal.com

"Цитату такой длины, чтобы робот ее опознал, вы сами опознаете и загуглите."



Нет, не опознаю. Особенно если это не Шекспир, а, допустим, знаменитая речь какого-нибудь президента.

Date: 2022-09-23 09:11 pm (UTC)
From: [identity profile] lu-crecia.livejournal.com
Это, действительно, интересная и, в принципе, решаемая задача.
Вопрос в том, найдется ли коммерческий заказчик на такую работу, или энтузиаст, который захочет это сделать.
Это ведь не только вопрос человекочасов и квалификации, чтобы обучить такую сетку, нужно много вычислительных ресурсов.
Для программ-переводчкиов они нашлись, всякие рисовалки по описанию тоже быстро совершенствуются, т.к. денег на этом можно зашибить немерено.
А вот поиск аллюзий — задача, с одной стороны, нетривиальная, а с другой, довольно ограниченно востребованная.
В наше время довольно мало людей хотят копаться в текстах и искать в них неочеведные смыслы.

Profile

kot_kam: (Default)
kot_kam

January 2026

S M T W T F S
     1 2 3
45 6 78910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 8th, 2026 11:59 pm
Powered by Dreamwidth Studios