Chuyên cung cấp tài liệu


Từ khóa cần tìm:

TextCapture- chương triÌ€nh bắt chữ maÌ£nh

Thứ ba - 23/09/2008 17:49
TextCapture- chương triÌ€nh bắt chữ maÌ£nh

TextCapture- chương triÌ€nh bắt chữ maÌ£nh

NhiêÌ€u chương triÌ€nh hỗ trơÌ£ bắt chữ tưÌ€ các file văn bản thường có nhươÌ£c điểm laÌ€ dung lươÌ£ng lớn, bắt chữ rất châÌ£m vaÌ€ thươÌ€ng bỏ sót... Chương trình TextCapture giúp khắc phục những hạn chế trên.

1- CaÌ€i đăÌ£t

 Chương triÌ€nh có dung lươÌ£ng 421 KB, có thể tải taÌ£i đây. Sau khi tải vêÌ€, nhấp chuôÌ£t kép vaÌ€o chương triÌ€nh nó, môÌ£t Pop-Up hiêÌ£n lên, nhấn Next > Accept > Yes để tiếp tuÌ£c.

Sau khi caÌ€i xong, môÌ£t Pop-Up hiêÌ£n lên, baÌ£n có các lưÌ£a choÌ£n những phím tắt để bắt đâÌ€u chuÌ£p ảnh khi nhấn vaÌ€o những phím naÌ€y. ChoÌ£n None nếu không muốn duÌ€ng phím tắt, maÌ€ duÌ€ng chương triÌ€nh theo cách thủ công. ChoÌ£n Shift + Ctrl, Ctrl + Alt hay Shift + Alt nếu muốn duÌ€ng những phím tắt tương ứng như trên để bắt đâÌ€u chuÌ£p ảnh. Nhấn Finish để hoaÌ€n tất quá triÌ€nh caÌ€i đăÌ£t.

Chương triÌ€nh Capture Text sẽ đươÌ£c tưÌ£ naÌ£p laÌ£i sau mỗi lâÌ€n máy khởi đôÌ£ng. Sau khi chương triÌ€nh khởi đôÌ£ng, baÌ£n sẽ thấy biểu tươÌ£ng của nó ở dưới System tray của Window.

2- Xây dưÌ£ng hêÌ£ thống thông tin font

Đây laÌ€ bước quan troÌ£ng nhất của viêÌ£c caÌ€i đăÌ£t vaÌ€ sử duÌ£ng TextCapture, và cũng chính laÌ€ điêÌ€u khiến cho TextCapture trở thaÌ€nh chương triÌ€nh chuÌ£p ảnh maÌ£nh nhất hiêÌ£n. Nó có thể chuÌ£p đươÌ£c bất cứ thứ giÌ€ vaÌ€ bóc đươÌ£c chữ tưÌ€ phâÌ€n lớn những thứ... có chữ trên đó.

Tuy nhiên, khả năng bóc chữ của TextCapture ở mỗi máy khác nhau thiÌ€ rất khác nhau. Ở môÌ£t số máy, nó có thể nó không lấy đươÌ£c giÌ€ tưÌ€ môÌ£t bức ảnh scan (vaÌ€ cũng chẳng môÌ£t chương triÌ€nh naÌ€o khác có thể laÌ€m đươÌ£c điêÌ€u naÌ€y trưÌ€ các phâÌ€n mêÌ€m viết riêng cho máy scan). Tuy nhiên, ở những máy khác, nó có thể lấy đươÌ£c tới 70% hay hơn nữa các chữ có trên đó.

Trong Pop-Up hiêÌ£n ra, nhấn OK để cho chương triÌ€nh tiến haÌ€nh doÌ€ tiÌ€m vaÌ€ đưa toaÌ€n bôÌ£ dữ liêÌ£u vêÌ€ các font chữ đang đươÌ£c duÌ€ng trong máy vaÌ€o bôÌ£ nguôÌ€n lưu trữ. MuÌ£c đích của viêÌ£c naÌ€y laÌ€ để khi muốn bóc chữ tưÌ€ môÌ£t bức ảnh, bản fax,..., text Capture chỉ viêÌ£c tiÌ€m đúng những điÌ£nh daÌ£ng font đã đươÌ£c xây dưÌ£ng trước trong thư viêÌ£n font, giúp copy những thứ baÌ£n muốn.

Tuy nhiên, điêÌ€u bất tiêÌ£n của phương pháp naÌ€y laÌ€ khi có môÌ£t font mới đưa vaÌ€o máy, baÌ£n phải xây dưÌ£ng laÌ£i bôÌ£ font cho chương triÌ€nh. MăÌ£t maÌ£nh của phương pháp naÌ€y so với những chương triÌ€nh khác, laÌ€ viêÌ£c có thể đoán chữ kiểu laÌ£ laÌ£ (chương triÌ€nh khác chắc chắn sẽ biÌ£ bỏ qua). ĐiêÌ€u đó giúp baÌ£n chỉ câÌ€n chỉnh sửa môÌ£t vaÌ€i sai sót nhỏ trong các dấu tiếng ViêÌ£t đươÌ£c chương triÌ€nh mô phỏng theo, hay môÌ£t vaÌ€i chữ coÌ€n thiếu trong văn bản.

TưÌ€ những điêÌ€u đã nói ở trên, khi caÌ€i đăÌ£t, TextCapture ở máy bạn chỉ tiÌ€m đươÌ£c 50 font, nhưng ở máy khác có thể tới 250 font. Sau khi hêÌ£ thống font chữ đã đươÌ£c xây dưÌ£ng, nhấn OK để khởi đôÌ£ng laÌ£i chương triÌ€nh.

3 - ChoÌ£n cách để chương triÌ€nh bóc chữ tưÌ€ ảnh

Nhấp chuôÌ£t phải lên biểu tươÌ£ng dấu côÌ£ng + của chương triÌ€nh trong Systemtray, vaÌ€ choÌ£n kiểu copy baÌ£n muốn.

- Select Text/Graphics Rectangle để chuÌ£p, bóc các chữ trong vuÌ€ng đã choÌ£n. BăÌ€ng cách naÌ€y, baÌ£n nhấn Shift + Ctrl rôÌ€i kéo chuôÌ£t để tô khối môÌ£t vuÌ€ng naÌ€o đó trên Windows để tách chữ ở trên đó. Trong Pop-Up hiêÌ£n ra, choÌ£n Default (all format)

- Select Text/Graphics of Window. Trong trươÌ€ng hơÌ£p không thể chuÌ£p đươÌ£c chữ tưÌ€ môÌ£t văn bản theo cách ở trên, hãy chuyển qua lưÌ£a choÌ£n naÌ€y, vaÌ€ khi nhấn Shift + Ctrl, chương triÌ€nh sẽ tiến haÌ€nh chuÌ£p laÌ£i toaÌ€n bôÌ£ các chữ có trên văn bản.

ĐôÌ€ng thơÌ€i, nó so sánh môÌ£t số chữ đã đươÌ£c chuÌ£p với môÌ£t số chữ chưa đươÌ£c điÌ£nh daÌ£ng. Sau đó, nó sẽ tiến haÌ€nh đoán xem những chữ kia laÌ€ giÌ€ vaÌ€ trả laÌ£i kết quả.

Cách chuÌ£p naÌ€y hơi lâu vaÌ€ mất công loÌ£c laÌ£i nôÌ£i dung muốn chuÌ£p, tuy nhiên nó có thể chuÌ£p nhiêÌ€u thứ maÌ€ các chương triÌ€nh khác không laÌ€m đươÌ£c.

- Native Text Select để chuÌ£p các chữ đươÌ£c xem laÌ€ tương phản trên nêÌ€n của bức ảnh, file scan... Cách chuÌ£p naÌ€y lâu nhất nhưng laÌ£i hiêÌ£u quả nhất viÌ€ nó có thể đoán đươÌ£c rất nhiêÌ€u chữ không có mã dưÌ£a trên những mã có sẵn tương tưÌ£. Tuy vâÌ£y, vấn đêÌ€ vẫn năÌ€m ở chỗ, máy tính có chứa đủ thông tin vaÌ€ các font chữ để hỗ trơÌ£ cho TextCapture hoaÌ£t đôÌ£ng hiêÌ£u quả không.

- Select Windows with Scolling. Đây laÌ€ cách để baÌ£n chuÌ£p toaÌ€n bôÌ£ các chữ có trong cửa sổ laÌ€m viêÌ£c của môÌ£t chương triÌ€nh. ĐôÌ£ maÌ£nh của nó tương đương như tính năng Select Text/Graphics Rectangle.

- Smart Text/Graphics Select. Nếu baÌ£n chuÌ£p môÌ£t văn bản rõ raÌ€ng thiÌ€ chuÌ£p băÌ€ng cách naÌ€y để đaÌ£t đươÌ£c tốc đôÌ£ chuÌ£p nhanh nhất. ĐăÌ£c biêÌ£t, nếu muốn chuÌ£p chữ hay bóc chữ tưÌ€ các chương triÌ€nh hoÌ£c anh văn, hay các lơÌ€i (baÌ€i hát) chaÌ£y trên maÌ€n hiÌ€nh của nhaÌ£c, file flash, video,...thiÌ€ cách naÌ€y giúp có đươÌ£c những kết quả chuÌ£p cưÌ£c nhanh.

- Select Graphics Rectangle. Trong trươÌ€ng hơÌ£p vẫn không thể chuÌ£p đươÌ£c các chữ trên văn bản, baÌ£n có thể taÌ£m thơÌ€i lưu laÌ£i tấm văn bản đó theo điÌ£nh daÌ£ng của mÌ£ôÌ£t tấm ảnh để sau naÌ€y khi đã bổ sung font mới, quay laÌ£i để bóc lấy nôÌ£i dung của nó.

NgoaÌ€i ra, khác với những chương triÌ€nh bóc chữ khác, chỉ có chức năng copy, maÌ€ không có chức năng chuÌ£p ảnh vaÌ€ các chương triÌ€nh chuÌ£p ảnh laÌ£i không có chức năng tách chữ tưÌ€ văn bản, thiÌ€ TextCapture có đủ cả hai tính năng trên. ViÌ€ vâÌ£y, baÌ£n có thể duÌ€ng môÌ£t chương triÌ€nh maÌ€ laÌ£i laÌ€m đươÌ£c viêÌ£c của rất nhiêÌ€u chương triÌ€nh gôÌ£p laÌ£i.

4 - Chọn cách copy

Sau khi đã choÌ£n xong cách bóc chữ tưÌ€ ảnh, chúng ta sẽ đến phâÌ€n lưÌ£a choÌ£n cách copy. TextCapture có thể đoÌ£c đươÌ£c rất nhiêÌ€u daÌ£ng chữ, tuy nhiên nếu không choÌ£n đươÌ£c cách copy phuÌ€ hơÌ£p, kết quả cũng như không. ViÌ€ vâÌ£y, bước choÌ£n kiểu copy cũng rất quan troÌ£ng.

ThươÌ€ng sau khi TextCapture tô khối đoaÌ£n văn bản xong thiÌ€ môÌ£t Pop-Up sẽ hiêÌ£n ra, choÌ£n:

- Default (all formats) nếu muốn copy tất cả những giÌ€ TextCapture đoÌ£c đươÌ£c. Trong trươÌ€ng hơÌ£p biÌ€nh thươÌ€ng, nên duÌ€ng lưÌ£a choÌ£n naÌ€y.

- Plain Text để chuÌ£p các chữ trong văn bản như Word, Excel, pdf,...

- RFT áp duÌ£ng cho các daÌ£ng khi mở băÌ€ng Notepad, Wordpad, các file batch, reg,...

- Graphics để chuÌ£p ảnh maÌ€n hiÌ€nh.

- Append Default để chuyển vêÌ€ daÌ£ng măÌ£c điÌ£nh (khi baÌ£n đang ở chế đôÌ£ Graphics)

- Plain Text Append để quay vêÌ€ daÌ£ng Plain Text (khi baÌ£n đang ở chế đôÌ£ khác).

- RTF Append để  quay vêÌ€ daÌ£ng RTF (khi baÌ£n đang ở chế đôÌ£ khác)

5: Bổ sung font cho TextCapture

Như đã nói ở trên, TextCapture trở thaÌ€nh chương triÌ€nh chuÌ£p ảnh vaÌ€ chuÌ£p chữ maÌ£nh nhất hiêÌ£n nay laÌ€ do bôÌ£ font đươÌ£c baÌ£n góp phâÌ€n xây dưÌ£ng cho chương triÌ€nh. ViÌ€ vâÌ£y, bổ sung caÌ€ng nhiêÌ€u fon, khả năng bắt chữ caÌ€ng cao.

BaÌ£n có thể lên maÌ£ng tải vêÌ€ các font có trong đó hoăÌ£c caÌ€i các bôÌ£ font trong Windows. VaÌ€o Start > Control Panel > Regional and Laguage Options > Languages:

- Đánh choÌ£n Install files for complex script and right-to-left languages (including

Thai) > OK > đưa đĩa CD Windows vaÌ€o ổ đĩa > Apply.

Sau khi caÌ€i xong, nhấp chuôÌ£t lên phím Details...> Add > choÌ£n tiếng Thai > OK > Apply. LaÌ€m tương tưÌ£ để đưa tiếng Ả RâÌ£p Arabic (Saudi Arabia), tiếng Nga Russian.

- Đánh choÌ£n Install files for East Asian languages > OK > đưa đĩa CD Windows vaÌ€o ổ đĩa > Apply.

Sau khi caÌ€i xong, nhấp chuôÌ£t lên phím Details...> Add > choÌ£n tiếng NhâÌ£t Bản > OK > Apply. LaÌ€m tương tưÌ£ để đưa tiếng HaÌ€n Quốc, tiếng Trung vaÌ€ tiếng TriêÌ€u Tiên vaÌ€o máy. BaÌ£n coÌ€n có thể đưa thêm các tiếng khác nếu thích.

NgoaÌ€i ra, để tăng hiêÌ£u quả bắt chữ, máy tính có caÌ€ng nhiêÌ€u font chữ daÌ£ng thư pháp caÌ€ng tốt, viÌ€ nó giúp bắt những chữ rất khó bắt như các chữ laÌ€m menu, chữ flash,...

Sau khi đã có thêm font mới, nhấp chuôÌ£t phải lên biểu tươÌ£ng dấu + của TextCapture trong SystemTray, choÌ£n Properties, vaÌ€o Control > Rebiuld Font Database... > OK để chương triÌ€nh câÌ£p nhâÌ£t thêm font mới.

Trong Highlight text, nhấn phím sổ xuống â–¼ rôÌ€i choÌ£n maÌ€u vaÌ€ng hay môÌ£t maÌ€u laÌ€m maÌ€u tô khối cho những chữ trong văn bản đươÌ£c TextCapture bắt đươÌ£c.

 6- ĐôÌ€ng nhất font chữ

Trong môÌ£t văn bản có nhiêÌ€u font khác nhau gôÌ€m tiếng ViêÌ£t, tiếng Anh, tiếng Hoa,... thiÌ€ khi copy chương triÌ€nh sẽ phải chuyển chúng vêÌ€ môÌ£t điÌ£nh daÌ£ng duy nhất. Nó giúp tránh đươÌ£c viêÌ£c in môÌ£t văn bản maÌ€ font chữ nhảy lung tung. MăÌ£t khác, có thể lơÌ£i duÌ£ng môÌ£t cách gián tiếp cách naÌ€y để chuyển môÌ£t văn bản có nhiêÌ€u font khác nhau thaÌ€nh môÌ£t văn bản với môÌ£t font thống nhất duy nhất.

Ví duÌ£: BaÌ£n có file A viết theo font Vini-Time, file B viết theo font Arial... Nếu muốn chuyển tất cả chúng thaÌ€nh môÌ£t font duy nhất, chỉ câÌ€n mở Microsoft Word lên vaÌ€ copy nôÌ£i dung hai file naÌ€y vaÌ€o trong, khởi đôÌ£ng để chương triÌ€nh tiến haÌ€nh bóc chữ tưÌ€ ảnh, thế laÌ€ có môÌ£t văn bản mới đôÌ€ng nhất giữa các font chữ.

Thông thươÌ€ng, bạn nên choÌ£n Copy Default (All Formats) nhưng trong những tiÌ€nh huống đăÌ£c biêÌ£t hoăÌ£c khi choÌ£n kiểu copy trên maÌ€ không copy đươÌ£c, nên thử laÌ£i với những cách copy khác. Sau đó, chỉ câÌ€n khởi đôÌ£ng môÌ£t chương triÌ€nh soaÌ£n văn bản rôÌ€i nhấn Ctrl + V laÌ€ xong.

Tác giả bài viết: Quang Tùng - GiangVien.Net

Nguồn tin: Tiền phong Online

Tổng số điểm của bài viết là: 0 trong 0 đánh giá
Click để đánh giá bài viết
Comment addGửi bình luận của bạn
Mã chống spamThay mới

Những tin mới hơn

Những tin cũ hơn

 
(Chú ý: Website đang trong giai đoạn hoạt động thử nghiệm, đang định xin giấy phép MXH của Bộ TT & TT)
Lên đầu trang
Array
(
    [type] => 8192
    [message] => preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead
    [file] => /home/pwhqfmvb/GiangVien/includes/countries.php
    [line] => 435
)