Սեպագիրը տվյալներ չի փոխանցում։ Նկարներից տեքստը ճանաչելու ծրագիր

Ուռա՜ Ազատ ծրագրերի համայնքը վերջապես համալրվել է ծրագրային ապահովմամբ, որը կարող է ճանաչել սկանավորված տեքստը ռուսերենով։ Գուցե ինչ-որ տեղ բլրի վրա կան անվճար ծրագրեր, որոնք կարող են ճանաչել լատինական այբուբենը, բայց դա այդպես չէր կիրիլիցայի դեպքում: Իսկ ռուսալեզու OCR-ի (օպտիկական տեքստի ճանաչման) դրոշակակիրը մնաց վճարովի FineReader(այժմ ընկերությունը ABBYYտարբերակը FineReader 9.0, որը մեր քաջարի ծովահենները վերջապես կոտրեցին): Փառահեղ 90-ականներին FineReader-ը քիչ թե շատ տանելի մրցակից ուներ CuneiForm, բայց որոշ ժամանակ անց այս ապրանքը Ճանաչողական տեխնոլոգիաներԿցված է 2000 տարբերակի վրա: Ես նույնիսկ կարծում էի, որ CuneiForm-ը սինթրեված է, սակայն...
սակայն, դեկտեմբերին 2007 թ Cognitive Technologies-ի ղեկավարությունը որոշել է CuneiForm-ը փոխանցել բաց կոդով. Ճիշտ է, մինչդեռ CuneiForm-ը թողարկվել է կնիքի տակ Անվճար ծրագիր, արտադրանքի տարբերակ 12. CuneiForm 12 բաշխումը ներառված է «Hard» n «soft» ամսագրի փետրվարյան թողարկման DVD-ում։
Երեկ ես տեղադրեցի այս արտադրանքը իմ համակարգչում և տխրեցի, ցանկացած տեքստ սկանավորելու բոլոր փորձերն ավարտվեցին անհաջողությամբ, այսինքն՝ պատուհան բացվեց: Տվյալների փոխանցման սխալԴե, ես կարծում եմ, որ դա հիմարություն է, այլ ոչ թե ծրագրակազմ, և ես մտածեցի հեռացնել ծրագիրը և ջնջել բաշխումը կոշտ սկավառակից…
բայց միտքս փոխեց. Իսկ այսօր ինձ մոտ միտք առաջացավ, որ եթե CuneiForm-ի միջոցով տեքստը ուղղակիորեն հնարավոր չէ սկանավորել, ապա կարող ես դա անել այլ ծրագրի միջոցով, այսինքն՝ հետո բացել պատկերը։ Ինչի՞ միջոցով պետք է սկանավորեմ: - Ես մտածեցի. Ի վերջո, եթե դուք սկանավորում եք վճարովի գրաֆիկական ծրագրերի միջոցով (Photoshop կամ ACDSee), ապա CuneiForm-ի անվճար լինելու իմաստը վերանում է։
Իմ անվճար գրաֆիկական ծրագրերի զինանոցը ներառում է GIMP 2.4.2, XnView 1.92Եվ IrfanView 4.10.Սկսեցի վերջինից և ստացված պատկերը պահեցի ձևաչափով տիֆ(մյուսները, ինչպիսիք են bmp-ը կամ jpg-ը, այս դեպքում չեն աշխատի): Արդյունքը ScanImage001 ֆայլն էր՝ 412 ԿԲ չափով: Անմիջապես կասեմ, որ թեստի համար օգտագործել եմ «Փիլիսոփայություն» դասագրքի 13-րդ էջը, խմբ. V.D. Gubina (M., 2004): Ճանաչումից հետո ստացված տեքստում մի քանի սխալներ են եղել (և որտեղ դրանք չկան, FineReader-ը ունի դրանք):
Այնուհետև ես սկանավորեցի նույն տեքստը GIMP-ի միջոցով: Անցնող ժամանակ նշեմ, որ ծրագրի բեռնումը բավական ժամանակ տևեց (իհարկե, սա դիտող չէ, այլ ամբողջական գրաֆիկական փաթեթ): No Name ելքային ֆայլը ծանր էր՝ 3,37 ՄԲ, բայց CuneiForm-ում դրա ճանաչման որակը մի փոքր ավելի լավ էր:
Թեստավորման չեմպիոնը դարձավ XnView-ը, որը արտադրեց 422 ԿԲ չափի 1 ֆայլ, որը CuneiForm-ը մյուսներից լավ ճանաչեց:
Այսպիսով, դա լավ սկիզբ է: Հուսով եմ, որ CuneiForm-ի նոր տարբերակները թույլ կտան անել առանց օժանդակ ծրագրերի:
Սպասիր եւ տես.

- խելացի տեքստի ճանաչման համակարգ: Ապահովում է թղթային փաստաթղթերի և էլեկտրոնային գրաֆիկական ֆայլերի արագ և որակյալ փոխակերպումը խմբագրվող տեքստի` գրասենյակային ծրագրերում և տեքստային խմբագրիչներում դրա հետ հետագա աշխատանքի համար: Արդյունքները կարող են պահպանվել հանրաճանաչ ձևաչափերով և ամբողջական տեքստի որոնում:
ՀնարավորություններըCuneiForm :
Ճանաչման ընթացքում պահպանվում են փաստաթղթի կառուցվածքը և ձևաչափումը։
Ճանաչում է ցանկացած կառուցվածքի և բարդության աղյուսակներ, այդ թվում՝ առանց աղյուսակի ցանցի գծերի ցուցադրման:
Ճանաչվում են ցանկացած տպագիր տառատեսակներ՝ գրքեր, թերթեր, ամսագրեր, տպագրություններ լազերային և մատրիցային տպիչներից, տեքստեր գրամեքենաներից և այլն:
Նիշերի ճանաչման օպտիկական ալգորիթմները (OCR, Optical Character Recognition) ծրագրում թույլ են տալիս ճանաչել տեքստը կետային մատրիցով տպիչից, վատ լուսապատճեններից և ֆաքսերից:
Փաստաթղթերի ճանաչում ավելի քան 20 լեզուներով՝ ռուսերեն, անգլերեն, ուկրաիներեն, գերմաներեն, ֆրանսերեն, իսպաներեն, իտալերեն և այլն:
Ճանաչման որակը բարելավելու համար ծրագիրը օգտագործում է բառարանի ստուգում: Միևնույն ժամանակ, ստանդարտ բառարանը կարող է ընդլայնվել՝ տեքստային ֆայլերից նոր բառեր ներմուծելով:
Նախագծի վրա աշխատանքը համակարգելու համար կա կայք OpenOCR.org ռուսալեզու ֆորումի հետ:
Ծրագրի կարգավիճակը.Անվճար
ՕՀ: Windows 7, Vista, XP
Ինտերֆեյս:Անգլերեն ռուսերեն
Մշակողը:Ճանաչողական տեխնոլոգիաներ
Չափը՝ 33.3 Մբ
ՆԵՐԲԵՌՆԵԼ OCR CuneiForm V.12
ՆԵՐԲԵՌՆԵԼ Cognitive OpenOCR (ռուսերեն)
ՆԵՐԲԵՌՆԵԼ Cognitive OpenOCR (անգլերեն)
Փոքր ձեռնարկ, թե ինչպես աշխատել.
Տեղադրվելուց հետո դուք կունենաք երկու դյուրանցումներ.

Խմբաքանակի ճանաչում - ամբողջ թղթապանակների մշակում:
CuneiForm - փաստաթղթերի մշակում սկաներից կամ առանձին ֆայլերից:
Եկեք գործարկենք ծրագիրը: Իմ կարծիքով, ծրագրի գործարկման երկրորդ տարբերակը հարմար է մեծամասնությանը։ Բացվող պատուհանում ընտրեք պատկերակը կախարդական փայտիկով (սլաքով):


Բացվում է Recognition Wizard պատուհանը: Ընտրեք աղբյուրի ֆայլի աղբյուրը (կոշտ սկավառակ կամ սկաներ): Օրինակ, ես ընտրեցի ֆայլ իմ կոշտ սկավառակի վրա:


Սեղմեք «Հաջորդ»: Բացվում է լեզվի ընտրության էջը, որտեղ ընտրում ենք (բնականաբար) լեզուն (սլաքը 1) և նշանը, որով կփոխարինվեն չճանաչված տառերը (սլաք 2):


Կրկին «Հաջորդ». Ընտրեք ճանաչված տեքստի պարամետրերը: Քանի որ ես ունեի սքանավորված ձեռագիր տեքստ, ընտրեցի «Բառապաշար» և «Ֆաքս»:


Եվ քանի որ սկզբնաղբյուր տեքստը չի պարունակում աղյուսակներ և նկարներ, ես հանեցի համապատասխան կետերը հաջորդ պարամետրի կետում:


Կրկին «Հաջորդ». Եվ ծրագիրը սկսեց մշակել տեքստը:


Ահա արդյունքը. Բնօրինակ հատվածը և ծրագրի կողմից մշակվելուց հետո։

Սրանք ձեռագիր հատվածի մշակման արդյունքներն են։
Եվ ահա սկանավորված մեքենագրված տեքստի մշակման արդյունքները(աղբյուրի պարամետրերը սահմանվում են նույնը):

Ինչպես տեսնում եք, արդյունքն ուղղակիորեն կախված է աղբյուրից: Վատ որակի ձեռագիր թեստ մշակելիս ավելի նպատակահարմար է այն մուտքագրել անմիջապես ձեռքով, քան մշակել ծրագրով և հետո խմբագրել:
Ուստի հրաշքի հույս չպետք է ունենալ։ Տեքստի ճանաչումից հետո բավական տքնաջան աշխատանք է մնում սխալները շտկելու համար:.
Պատրաստված է computer-vsem.ru, cognitiveforms.com, softportal.com նյութերի հիման վրա
Տեքստի կազմումև հղումներ

Հավելվածի հիմնական հատկանիշները

  • տեքստային փաստաթղթերի ճանաչում ավելի քան քսան լեզուներով, ներառյալ ռուսերեն, ուկրաիներեն, անգլերեն, իսպաներեն, գերմաներեն, ֆրանսերեն;
  • բոլոր տպագիր տառատեսակների ճանաչումը գրքերից, ամսագրերից, թերթերից, գրամեքենաներից, կետային և լազերային տպիչներից տպագրված տպագրությունները և այլն;
  • ներկառուցված օպտիկական ալգորիթմներ, որոնք կարող են ճանաչել տեքստը ցածրորակ ֆաքսերից կամ լուսապատճեններից;
  • տարբեր կառուցվածքներով և բարդության աստիճաններով աղյուսակներ կարդալու ունակություն, նույնիսկ եթե աղյուսակի ցանցի գծերը չեն ցուցադրվում.
  • փաստաթղթի կառուցվածքի և ձևաչափի պահպանում.
  • բառարանի ստուգում՝ որակը բարելավելու համար (բառարանն ընդլայնվում է՝ տեքստերից նոր բառեր ներմուծելով):

Ծրագրում ստացված բոլոր վերջնական արդյունքները կարող են պահպանվել գրեթե բոլոր հայտնի ձևաչափերով, այնուհետև հարմար և արագ գտնել ամբողջական տեքստի որոնման միջոցով:

Տարբերությունները CuneiForm-ի և անալոգների միջև

CuneiForm-ը տարբերվում է նմանատիպ այլ ծրագրերից իր ճանաչման տեխնոլոգիայի բարձր մակարդակով, հզոր տեքստային խմբագրիչով և ներկառուցված կախարդների առկայությամբ: Հավելվածը նույնիսկ ճանաչում է այն լուսանկարված կամ սկանավորված տեքստերը, որոնք առանձնապես ցածր որակ ունեն։
Ծրագիրը արդյունավետ կերպով փոխակերպում է էլեկտրոնային գրաֆիկական ֆայլերը և թղթային փաստաթղթերը տեքստի՝ կոմերցիոն կոմունալ ծառայությունների մակարդակով խմբագրելու համար՝ միաժամանակ լինելով բացարձակապես անվճար:
Նմանատիպ ֆունկցիոնալությամբ հավելվածներ՝ ABBYY FineReader, Tesseract, VietOCR և այլն:

Աշխատանքային սկզբունքներ

Ծրագրի տեղադրման հետ կապված դժվարություններ չկան, պարզապես անհրաժեշտ է գործարկել հատուկ տեղադրման ֆայլը և հետևել ցուցադրված հրահանգներին:
Ինտերֆեյսը բավականին պարզ է և գործնականում չի պահանջում որևէ լրացուցիչ կարգավորում: Հիմնական գործողությունները կատարվում են գործիքագոտու վրա տեղադրված կոճակների միջոցով:

CuneiForm ինտերֆեյս

Նախ պետք է համոզվեք, որ ծրագիրը աջակցում է ձեր սկաներին: Եթե ​​այո, ապա կարող եք սեղմել «Ստացեք պատկեր» կոճակը կամ բացել ավարտված սկանավորումը: Այնուհետև կատարվում է նշում, ճանաչում և արդյունքը պահպանվում է անհրաժեշտ ձևաչափով:
Պարամետրերում (Ֆայլ - Ընդհանուր կարգավորումներ) կարող եք փոխել լեզուն և ֆորմատավորման, պահպանման և սկանավորման որոշ այլ տարբերակներ:

Ճանաչման հրաշագործ. Պատկեր

Ընդհանուր պարամետրեր

Ընդհանուր պարամետրեր

CuneiForm-ը բավականին հզոր և ֆունկցիոնալ ծրագիր է, որի հնարավորությունների միջոցով կարող եք ճանաչել ցանկացած լուսանկարված և սկանավորված տեքստ:

Վերջերս ես սկսեցի փնտրել անվճար հավելվածներ՝ սկանավորված տեքստը ճանաչելու համար, կամ ինչպես կոչվում են նաև OCR ծրագրեր։ Հանրահայտ ABBYY FineReader հրեշի համար վճարելու ցանկություն չկար, բայց, ինչպես պարզվեց, նրանք շատ քիչ տարբերակներ են առաջարկում նման տեսակի ծրագրերի համար անվճար օգտագործման համար: Առաջին տարբերակը, որը հանդիպեց, պարզվեց, որ Windows-ի համար, թերևս, ամենահայտնի ծրագրերից մեկն էր, բայց ներկայիս տեսքով այն բարեկամական չէ ռուսերենի հետ: Բլոգի ընթերցողներից մեկն առաջարկեց փորձել հայրենական ծրագրավորողների աշխատանքները։

Տեղադրման կարգը ստանդարտ է, մի քանի ստանդարտ հարցերի ցանկ, որտեղ ամենահիշարժանը լիցենզային պայմանագիրն է և այն թղթապանակի ընտրությունը, որտեղ տեղադրվելու է ծրագիրը: Մի քանի վայրկյան սպասում և ամեն ինչ պատրաստ է: Լրացուցիչ ոչինչ տեղադրված չէ, և դուք նույնպես պետք չէ ներբեռնել և տեղադրել լրացուցիչ ծրագրային բաղադրիչներ:

Ծրագիրը գործարկելուց հետո մենք ստանում ենք ստանդարտ ինտերֆեյս OCR-ի համար, մի քանի տարրերով ընտրացանկ, հիմնական գործառույթներին մուտք գործելու մեծ կոճակներ, և հիմնական պատուհանը բաժանված է երկու մասի պատկերի և պատրաստի տեքստի համար, որոնք ճանաչվել են:

Գործիքադարակի հենց առաջին կոճակը, որտեղ գծված է կախարդական փայտիկը, կախարդ է, որը գործարկելով մենք կանցնենք բոլոր փուլերը՝ սկսած սկանավորումից և վերջացրած խմբագրման համար հարմար պատրաստի տեքստով, որը զգուշորեն կառաջարկի ընտրել անհրաժեշտը։ կարգավորումներ. Արդյունքը կլինի մի տեսակ կիսաավտոմատ ռեժիմ՝ գործ ունենալով միայն ընդհանուր կարգավորումների հետ՝ առանց նրբությունների մեջ խորանալու։

Դուք կարող եք գնալ ավելի բարդ ճանապարհով՝ անցնելով յուրաքանչյուր կետ առանձին, բայց կարող եք կատարել մի շարք լրացուցիչ խմբագրումներ և նուրբ ճշգրտումներ, որոնք թույլ կտան ավելի լավ վերջնական արդյունք ստանալ:

Օգտագործելով կոճակը, որտեղ գծված է սկաները, մենք կարող ենք սկանավորել ցանկալի փաստաթուղթը կամ վերբեռնել պատրաստի պատկերը: Որից հետո մենք ստանում ենք գործիքագոտի, որով կարող ենք ուղղել պատկերը, պտտել այն և ընտրել ճանաչման տարածք։

Կողմնացույցով կոճակը թույլ է տալիս նշել էջը՝ ընդգծելով սյունակները, պատկերները և տեքստի բլոկները: Բոլոր հայտնաբերված բլոկները կարող են խմբագրվել՝ դրանք տեղափոխելով և չափափոխելով մկնիկի միջոցով: Կուրսորը տեղափոխեք կապույտ գծերի մոտ և կտեսնեք, թե ինչպես է այն փոխելու իր ձևը, այնուհետև, կարծում եմ, ինքներդ կհասկանաք:

Ակնոցներով պատկերակ օգտագործելով՝ մենք տեքստը ճանաչում ենք անմիջապես պատրաստված հատվածներում: Տեքստը պատրաստ լինելուց հետո սեղմեք ցանկացած տառի վրա և կտեսնեք նկարի այն հատվածը, որտեղ այն գտնվել է։

Ինքնաթիռի հետ կոճակը նախատեսված է ճանաչված տեքստը ֆայլերում կամ Word Excel-ում պահելու համար, ինչու այս ստանդարտ հավաքածուն կրկին անհասկանալի է, քանի որ դեռևս կան շատ հրաշալի տեքստային խմբագրիչներ:

Կախված նրանից, թե որ փուլում եք գտնվում, գործիքագոտին կփոխի իր բովանդակությունը՝ առաջարկելով որոշակի փուլում անհրաժեշտ գործիքները:

Հիմա եկեք անցնենք տխուրին. Windows 7-ը հրաժարվեց աշխատել սկաների հետ, ծրագիրը տեսավ այն, սկաները նույնիսկ սկսեց բզզալ, և մոնիտորի վրա մի կետագիծ վազեց, որը ցույց էր տալիս, որ տվյալները փոխանցվում են, և վերջում այն սխալ է նետել. Բոլոր դափով պարելը և ֆորումները կարդալը դրական արդյունք չտվեցին։ Ներառյալ «Face.INI» ֆայլի խմբագրումը, որտեղ, ինչպես խորհուրդ է տրվում, «TWAIN_TransferMode=memory-buffered»-ը շտկվել է TWAIN_TransferMode=հիշողության բնիկ»: Արդյունքում, ես ստիպված էի լուծում կատարել, սկանավորել տեքստը Windows-ի ստանդարտ գործիքների միջոցով և պատրաստի պատկերը տեղադրել CuneiForm-ում:

Նաև վատ է, որ PDF ֆայլերը չեն աջակցվում հենց ծրագրի կողմից: Դուք պետք է դիմեք լուծումների, օգտագործեք երրորդ կողմի ծրագրեր pdf փաստաթղթերից նկարներ պատրաստելու համար, այնուհետև օգտագործեք OCR: Բայց նորից, նկարների ցածր լուծաչափի պատճառով, տեքստի ճանաչման որակը շատ ցածր է, ուստի պետք է շատ բաներ ձեռքով ուղղել։

Քիչ էր մնում մոռանայի, Windows Vista-ի և 7-ի առաջին գործարկումն ավելի լավ է արվի որպես ադմինիստրատոր, հակառակ դեպքում ծրագիրը մի քանի րոպեով կմնա տրանսի մեջ՝ կյանքի նշաններ ցույց տալով:

Ծրագիրն իսկապես աշխատում է բոլոր հիմնական լեզուների հետ, որոնցից մոտ 20-ը կա՝ ներառյալ ռուսերեն, անգլերեն, ուկրաիներեն, գերմաներեն, ֆրանսերեն, իսպաներեն, իտալերեն և խառը ռուսերեն-անգլերեն:

CuneiForm-ը խառը տպավորություն է թողել. թվում է, թե այն աշխատում է, բայց ոչ ամբողջությամբ, ամենայն հավանականությամբ այն պատճառով, որ ծրագրի վրա աշխատանքը դադարեցվել է 2007 թվականին, և սկզբնաղբյուրների բացումից հետո թիմը, որը կարող էր հետագայում զարգացնել նախագիծը, այդպես էլ չստացավ: միասին. Հաճելի է, որ ռուսերենը հասկանում է, բայց դուք պետք է մի փոքր ընտելանաք դրան, մինչ կսովորեք ընտրել նորմալ պարամետրեր սկանավորման համար, որպեսզի ճանաչման արդյունքները գոհացուցիչ լինեն: Ես հիմա այս փուլում եմ։

Իր ներկայիս տեսքով ես չեմ կարող խորհուրդ տալ այն սովորական օգտագործողների կողմից օգտագործելու համար: Նրանք, ովքեր համարձակվում են փորձել CuneiForm-ը, հոգեպես պատրաստ եղեք, որ առաջին անգամ լավ արդյունքներ չեք ստանա, և ստիպված կլինեք լուծումներ փնտրել ինքներդ ձեզ ծագած խնդիրների համար:

Աշխատում է 32 և 64 բիթ օպերացիոն համակարգերում: Ինտերֆեյսը ամբողջությամբ ռուսերեն է, և թվում է, որ այլ տարբերակներ չեն առաջարկվում:

CuneiForm-ի անվճար ներբեռնման էջ http://www.cuneiform.ru/downloads/index.html

Վերջին տարբերակը CuneiForm V12 գրելու պահին

Ծրագրի չափը՝ արխիվ 33.3 ՄԲ

Համատեղելիություն՝ Windows Vista և 7, Windows Xp

Տեքստի ճանաչումը շատ հարմար հատկություն է։ Այլևս կարիք չկա գրքերից և հոդվածներից մեծ ծավալներ վերագրել: Ուսուցիչների, ուսանողների և հետազոտողների համար նման ծրագրային հավելվածներն իսկական նվեր են: Եկեք դիտարկենք տարբեր հավելվածներ և որոշենք, թե պատկերից տեքստը ճանաչելու որ ծրագիրն է լավագույնը:

Ինչպես է դա աշխատում

Նիշերի օպտիկական ճանաչումը (OCR) տեքստը գրաֆիկական ձևից (լուսանկար, սկան, pdf) սովորական ձևաչափի փոխակերպելու ունակություն է: Փոխարկված տեքստը կարող է խմբագրվել:
Ցանկացած ռաստերային պատկեր բաղկացած է կետերից: Ճանաչման ծրագիրը նույնականացնում է նկարի տառերը և դրանք վերածում տեքստի: Փաստաթղթի կառուցվածքը վերլուծվում է: Տեքստային բլոկները ընդգծված են: Այնուհետև գծվում են գծեր, որոնք բաժանվում են բառերի, իսկ հետո՝ խորհրդանիշների։ Յուրաքանչյուր կերպար համեմատվում է նախշերի հետ: Որից հետո վարկածներ են արվում, թե դա ինչ սիմվոլի մասին է։ Դրանց հիման վրա ծրագրաշարը վերլուծում է տողերը բառերի, իսկ բառերը նիշերի բաժանելու տարբեր տարբերակներ: Նման վարկածների թիվը հսկայական է։ Ի վերջո, ծրագիրը որոշում է կայացնում և թողարկում է տեքստը:

Ծրագրային ապահովման ակնարկ

Պայմանականորեն, բոլոր դիմումները կարելի է բաժանել երեք կատեգորիայի.

  • Վճարված.
  • Անվճար.
  • Առցանց ծառայություններ.

Եկեք նայենք յուրաքանչյուր բաժնի մի քանի տարբերակ:

Վճարովի և անվճար ծրագրեր

OCR CuneiForm

Սկանավորված տեքստը ճանաչելու անվճար ծրագիր, որը կարելի է ներբեռնել այստեղ:

Հավելվածը մշակվել է 1993 թվականին Cognitive Technologies ընկերության կողմից։ Այդ ժամանակ նրա հիմնական առանձնահատկություններից էր ռուսերեն և անգլերեն լեզուների խառնուրդը ճանաչելու ունակությունը։ 2009 թվականին ավելացվեց մասնաճյուղ, որը թույլ է տալիս ճանաչել այլ լեզուների խառնուրդը: Ծրագրային արտադրանքը մատակարարվել է սկաներներով և MFP-ներով առաջատար արտադրողներից՝ Hewlet-Pachard, Epson, Xerox և այլն: Վերջին տարբերակը թողարկվել է 2009 թվականին։
Ներբեռնելուց և տեղադրելուց հետո մենք փորձում ենք ճանաչել տեքստը։ Որպես օրինակ վերցնենք այս հոդվածը։

Ծրագրի ինտերֆեյսը պարզ է, ճաշացանկը ռուսերեն է:


Սեղմեք թղթապանակի պատկերակը և վերբեռնեք պատկերը: Սեղմեք ճանաչման կոճակը:


Արդյունքը տպավորիչ չէ. Բազմագույն տեքստը չի ճանաչվում:


Չնայած տարբեր բառարանների օգտագործմանը, անգլերենը նույնպես վատ էր ճանաչվում:


Ընդհանուր առմամբ, իդեալական լուսանկարը կարելի է թարգմանել սիմվոլների, բայց որքան ցածր է բնօրինակ պատկերի որակը, այնքան ցածր է արդյունքի որակը:
Հարկ է նշել, որ սա սկանավորման միակ ռուսացված տեքստի ճանաչման ծրագիրն է, որը ներբեռնվել է անվճար օրինական եղանակով։ Բոլոր մյուսները, լավագույն դեպքում, ունեն անվճար փորձաշրջան:

RiDoc

Լուսանկարից կամ սկաներից տեքստը ճանաչելու ծրագիր՝ 30 օր անվճար փորձաշրջանով: Այն կարող եք ներբեռնել այստեղից:

Հավելվածն ունի լավ ֆունկցիոնալություն և մատչելի ինտերֆեյս: Պատկերը բեռնելու համար սեղմեք «Բացել» կոճակը:


Հաջորդը «Ճանաչել» կոճակն է:


Արդյունքում մենք ստանում ենք ավարտված արդյունքը։ Այն կարող է բացվել Word կամ OpenOffice-ում:


Ահա արդյունքը.


Նաև իդեալական չէ, բայց շատ ավելին, քան նախորդ դեպքում:
Կարող եք նաև ջրի մակարդակի նշագիծ ավելացնել կամ միացնել մի քանի պատկեր:

ReadIris

Վճարովի ծրագրային արտադրանք՝ 100 էջ կամ 10 օր փորձնական տարբերակով: Տեքստի ճանաչման սկաների ծրագիրը կարող եք ներբեռնել պաշտոնական կայքից այստեղ:

Մշակողը բելգիական IRIS ընկերությունն է, որը ստեղծվել է 1986 թվականին։ Հիմնական մասնագիտացումը փաստաթղթերի խելացի ճանաչման տեխնոլոգիաներն ու արտադրանքներն են:

Ծրագիրը փոխակերպում է նկարը, PDF ֆայլը կամ սկանավորված փաստաթուղթը ամբողջությամբ խմբագրվող տեքստային ֆայլի: Քաղում է տեքստը ձեր փաստաթղթերից՝ պահպանելով բնօրինակ ֆայլի դասավորությունը: Ունի հետևյալ հատկանիշները.

  • փոխարկել Word, Excel և PowerPoint ֆայլերը ինդեքսավորված PDF ֆայլերի;
  • փաստաթղթերի փոխակերպում, օգտագործելով համատեքստային մենյու;
  • ներմուծվող փաստաթղթերի որակի ցուցիչ;
  • սկաներների ավտոմատ հայտնաբերում;
  • հեռանկարների ուղղման մոդուլ:

Ծրագրի ինտերֆեյսը ռուսաֆիկացված է (նշված է տեղադրման ժամանակ) և բավականին պարզ է:


Կտտացրեք «Ֆայլից» կոճակը և ընտրեք մեր պատկերը: Ծրագիրը ավտոմատ կերպով բաժանեց այն երկու բլոկի:


Ճանաչման համար սեղմեք «Բացել» կոճակը և նշեք նկարի ուղին: Ձևաչափը նշված է վերևի տողում:


Արդյունքը գերազանցեց բոլոր սպասելիքները. Պահպանվել է նույնիսկ ուրվագիծը։


Դուք կարող եք փաստաթուղթն ուղարկել փոստով կամ ամպի միջոցով: Դա անելու համար սեղմեք վերը նշված ցանկի վրա և ընտրեք. Լռելյայնորեն այն պահվում է ֆայլում:


Այս ծրագրի արժեքը մոտ 6000 ռուբլի է:

ABBYY FineReader

Ամենահայտնի և գովազդվող ծրագիրը: Փորձնական տարբերակը կարող եք ներբեռնել այստեղից:

Վճարված արժեքը 6990 ռուբլի է: 1993 թվականի ռուսական մշակումը մինչ այժմ համարվում է աշխարհում լավագույններից մեկը: Հիմնական հատկանիշները:

  • Աղյուսակների և գրաֆիկների ճանաչում, մաթեմատիկական բանաձևեր.
  • Դիտեք և նավարկեք pdf-ում:
  • Ստեղծեք և ուղղակիորեն խմբագրեք pdf:
  • Աշխատեք թվային ստորագրությամբ:
  • Փաստաթղթերի համեմատություն.
  • Մեկնաբանությունների ավելացում։

Ծրագիրն ունի բազմաթիվ առանձնահատկություններ. Ինտերֆեյսը ռուսացված է և հասանելի:


«Բացել» կոճակը սեղմելուց և նկար ընտրելուց հետո սկսվում է դրա ավտոմատ բաժանումը բլոկների:


Գործընթացը սկսելու համար սեղմեք համապատասխան կոճակը:


Մնում է միայն ընտրել, թե ինչ ձևաչափով պահել և նշել այն թղթապանակը, որտեղ պետք է պահպանվի փաստաթուղթը:


Եկեք բացենք արդյունքը. Ինչպես տեսնում եք, ճանաչումը հիանալի անցավ։


Կրկին համեմատեք ReadIris-ի հետ:


Առաջին տարբերակը (Finereader) կատարվում է անթերի: Հետեւաբար, թերեւս, մենք ափը տալիս ենք այս ծրագրին։ Նրանք համեմատելի են գնով, ուստի 600-700 ռուբլի տարբերությունը հատուկ դեր չի խաղում:

Տեքստի ճանաչում լուսանկարներից առցանց

IMGonline

Առցանց պատկերների մշակման ծառայություն։ Կայքը տրամադրում է գործիքներ.

  • Սեղմել և չափափոխել նկարը
  • Կտրում, խուզում
  • Ներկառուցված մետատվյալների մշակում
  • Էֆեկտներ
  • Բարելավումներ
  • Գունավոր պալիտրա նկարների սահմանում
  • Ստանալով ֆոն
  • Նմանության տոկոսի որոշում և այլն:

Հարմար կայք, որը տալիս է պատկերների մշակման բազմաթիվ հնարավորություններ։ Ինտերֆեյսը պարզ է և պարզ:


Առաջարկում է երկու ծրագիր. Եկեք համեմատենք. Վերբեռնեք ֆայլը և սեղմեք OK:


Հաջորդը, սեղմեք հղմանը:


Արդյունքը հուսադրող չէ.


Փորձենք երկրորդ ծրագիրը։


Նաև կասկածելի.


Եկեք սահմանենք լրացուցիչ լեզու:


Եկեք ստուգենք արդյունքը:

Մի փոքր ավելի լավ, բայց հեռու կատարյալ լինելուց:

img2txt

Լուսանկարներից առցանց տեքստը ճանաչելու ծրագիրը թույլ չի տալիս սկանավորել:

Կայքը գործում է 2014 թվականից։ Մշակողները, բացի ընթացիկից, այլ ծառայություններ չեն նախատեսում։


Ընտրեք ֆայլը և սեղմեք «Վերբեռնում»: Այնուհետև կտտացրեք «Սկսել ճանաչումը»:

Արդյունքը նույնպես հեռու է կատարյալ լինելուց:

Convertio

Բավականին մեծ վճարովի պորտալ, որտեղ կարող եք օգտվել հետևյալ հնարավորություններից.

  • Փոխակերպել վիդեո, աուդիո, նկարներ:
  • Փոխարկել PDF-ը Word, Excel, PowerPoint-ի:
  • PDF բաժանում.
  • Սեղմեք PDF, PNG և այլն:

Գործողության սկզբունքը բացարձակապես նման է, բայց կան ավելի շատ պարամետրեր: Նկարները կարելի է քաշել և թողնել:


Դուք կարող եք նշել մի քանի լեզու և փաստաթղթի տեսակը, որտեղ արդյունքը պահպանվում է:


Չգրանցված օգտվողներին հասանելի է միայն 10 էջ՝ ճանաչման համար:
Captcha-ի վրա սեղմելուց հետո ընտրեք «Փոխակերպել»:


Սեղմեք ներբեռնել:


Արդյունքը գերազանցեց բոլոր սպասելիքները.


Պարզվում է, որ պարզ առցանց ծառայություններն ունեն նաև բարձրորակ ճանաչում ապահովելու հնարավորություն։ Այսպիսով, Convertio-ն հայտարարվում է այս անվանակարգում ակնհայտ հաղթող: Բայց ինչպես ցանկացած հիանալի ապրանք, այն ունի իր ծախսերը:

Այսպիսով, մենք նայեցինք տարբեր OCR գործիքներ: Պարզվեց, որ անվճարները կարող են օգնել, բայց որակը մնում է բարձր մակարդակի: Այսպիսով, եթե ձեզ անընդհատ անհրաժեշտ է տեքստը տպագիրից էլեկտրոնայինի վերածել, ապա ստիպված կլինեք որոշակի գումար ծախսել:

Հիանալի օր անցկացրեք:



Կիսվել