Напомните, как раскодировать русский текст вида Í&a

Обсуждение проблем, связанных с ПО для компьютеров

Модераторы: Al_lexx, Sharp, ionika, Happy_MAN, 0xFF, Atom, Serega S.U.

Ответить
Аватара пользователя
SoftModerator
Сообщения: 2811
Зарегистрирован: 16 июн 2006, 14:08
Откуда: Видное
Контактная информация:

Напомните, как раскодировать русский текст вида Í&a

Сообщение SoftModerator » 21 мар 2008, 10:13

Íåäàâíî ðàçðàáîò÷èêè ðåøèëè îæèâèòü ïðîåêò, è 12 äåêàáðÿ 2007 ãîäà ïåðåäàëè èñõîäíûé êîä CuneiForm ñîîáùåñòâó Open Source. Íîâàÿ, äâåíàäöàòàÿ âåðñèÿ ïðîãðàììû ïîçâîëÿåò ñêàíèðîâàòü äîêóìåíòû ñ ãèáêîé íàñòðîéêîé êà÷åñòâà, ïîääåðæèâàåò áîëåå äâàäöàòè ÿçûêîâ ðàñïîçíàâàíèÿ è äàæå ïîíèìàåò ñìåøàííûå ðóññêî-àíãëèéñêèå òåêñòû.

Штирлиц не распознает....
Жутко, страшно, кошмарно злой SoftModerator

Аватара пользователя
uza
Сообщения: 922
Зарегистрирован: 16 янв 2008, 13:54

Сообщение uza » 21 мар 2008, 10:50

Недавно разработчики решили оживить проект, и 12 декабря 2007 года передали исходный код CuneiForm сообществу Open Source. Новая, двенадцатая версия программы позволяет сканировать документы с гибкой настройкой качества, поддерживает более двадцати языков распознавания и даже понимает смешанные русско-английские тексты.

У вас какой то не такой Штирлиц :) (у меня 4.01)

Аватара пользователя
Happy_MAN
Молодой Админ
Сообщения: 1739
Зарегистрирован: 17 июл 2006, 06:23
Откуда: Kaliningrad
Контактная информация:

Сообщение Happy_MAN » 21 мар 2008, 11:47

яюНедавноразработчикирешилиоживитьпроект,и12декабря2007года
передалиисходныйкодCuneiFormсообществуOpenSource.Новая,
двенадцатаяверсияпрограммыпозволяетсканроватьдокументысгибкой
настройкойкачества,поддерживаетболеедвадцатиязыковраспознава
нияидажепонимаетсмешанныерусско-английскиетексты
Вот перевод :D
Я не заморачивался и просто сохранил текст в текстовом файле, обозвал его расширением .html, открыл в опере и поменял клдировку на Windows-1251 :D
То же самое можно сделать любым более менее продвинутым последователем Блокнота
Россия - страна недокументированных возможностей..
Жил был программист, и было у него два сына - Антон и Неантон :)

Аватара пользователя
SoftModerator
Сообщения: 2811
Зарегистрирован: 16 июн 2006, 14:08
Откуда: Видное
Контактная информация:

Сообщение SoftModerator » 21 мар 2008, 12:57

и у меня 4.01 и нифига не декодирует...
тогда такой вопрос - с какой кодировки на Win1251 надо менять? просто такого текста много... и в html все не переведешь - там куски нормально, а куски - такая бня...
Жутко, страшно, кошмарно злой SoftModerator

Аватара пользователя
Horandy
Сообщения: 126
Зарегистрирован: 20 дек 2006, 12:59

Сообщение Horandy » 21 мар 2008, 14:24

У меня получилось так:
Скопировал текст в блокнот, сохранил в Юникод, потом просто открыл Штирлицем.
Когда много спрашивают - мало думают и плохо помнят.
А. М. Горький

Аватара пользователя
uza
Сообщения: 922
Зарегистрирован: 16 янв 2008, 13:54

Сообщение uza » 21 мар 2008, 16:10

А... Дошло до меня. Я ж тут это, на работе смотрел, а там что то в реестре с кодировкой подшаманено, чтобы ERWin кириллицу любил и уважал - может это повлияло?
Удалил этот форум из избранного!

Аватара пользователя
0xFF
entity
Сообщения: 5310
Зарегистрирован: 22 июн 2006, 09:15
Контактная информация:

Сообщение 0xFF » 21 мар 2008, 23:37

SoftModerator
http://alexboiko.narod.ru/prod.html
взял этот текст на раз. Там авторежим.

PS И эта "бня" - на самом деле бытовая Base64 ;)
Три пути ведут к знанию: путь размышления - это путь самый благородный, путь подражания - это путь самый легкий и путь опыта - это путь самый горький. - Конфуций

Аватара пользователя
SoftModerator
Сообщения: 2811
Зарегистрирован: 16 июн 2006, 14:08
Откуда: Видное
Контактная информация:

Сообщение SoftModerator » 26 мар 2008, 17:34

ага, спасибо!
Жутко, страшно, кошмарно злой SoftModerator

Аватара пользователя
MegaAf
Сообщения: 772
Зарегистрирован: 06 ноя 2006, 00:44

Сообщение MegaAf » 26 мар 2008, 20:59

а я в Word обычно вставляю и в сервисе выбираю восстановить повреждённый текст - кстати вот ответ:

Код: Выделить всё

Недавно разработчики решили оживить проект, и 12 декабря 2007 года передали исходный код CuneiForm сообществу Open Source. Новая, двенадцатая версия программы позволяет сканировать документы с гибкой настройкой качества, поддерживает более двадцати языков распознавания и даже понимает смешанные русско-английские тексты.
У желания 1000 возможностей, у нежелания 1000 причин!!! :: AMD Athlon XP 2500+ GF5200 -> ATi-AMD Athlon 64 X2 5200+ Ati Radeon 3850

Restart
Сообщения: 1644
Зарегистрирован: 26 окт 2008, 14:33

Re: Напомните, как раскодировать русский текст вида Í&a

Сообщение Restart » 13 фев 2012, 11:31

el-vira-hadieva писал(а):Вот часть текста. Его бы раскодировать до марта
UTF-8
Нужно, чтобы шрифты стояли разных языков

Аватара пользователя
Pif-Puf
Сообщения: 189
Зарегистрирован: 08 май 2007, 23:27
Откуда: Москва

Re: Напомните, как раскодировать русский текст вида Í&a

Сообщение Pif-Puf » 24 фев 2012, 00:10

Вот ещё вариант решения подобных проблем, онлайновый : http://www.artlebedev.ru/tools/decoder/. Правда, с задачкой от el-vira-hadieva этот способ не помог. Может там и не всё текст?

Аватара пользователя
Al_lexx
Сообщения: 15308
Зарегистрирован: 10 авг 2006, 00:05
Откуда: Местный
Контактная информация:

Re: Напомните, как раскодировать русский текст вида Í&a

Сообщение Al_lexx » 24 фев 2012, 00:49

О, Ё!
Та же тема, барышня, офис, чиф купил эйрбук...

2 el-vira-hadieva
Похоже вам прислали с макинтоша.
Попробуйте наладить связь (деликатный разговор) с теми, кто вас нанял на работу.
Имхо.
Проходили много раз. Ничего страшного. :wink:

....есть осюсение, что тут маки порылись.
Беда с ними, с пузато-богатыми. Купят железку и ну всех строить под нея..... :smoking:

Или что то иначе?


??
Изображение
Что то ищете? В GOOGLE!

Ответить