Hướng dẫn - giải đáp thắc mắc về Convert!

huyen2207

Luyện Khí Trung Kỳ
Ngọc
255,75
Tu vi
34,00
Do hiện tại Forum đã không có màu cho các bang phái nên ta nghĩ và mong muốn toàn giáo đồ hãy cố gắng lấy màu Converter làm màu chính cho Thánh Giáo!
Convert nói dễ cũng không dễ và nói khó thì càng không! Chỉ cần mọi người chú tâm và chịu khó học hỏi thì 1 vài ngày là có thể convert ngon lành ngay.


Sau đây ta sẽ giới thiệu sơ qua về chương trình convert mà ta thường dùng!
Note:
Bài này có thể sẽ kéo dài trong vài ngày vì ta cũng không nhiều thời gian nên mỗi ngày sẽ làm 1 ít. Ngoài ra cũng xin nhờ 1 số converter trong giáo như con Hít, tên MC ... chia sẻ kinh nghiệm!

1. Convert truyện là gì?
Convert truyện nói nôm na là chuyển 1 đầu truyện từ ngôn ngữ này sang ngôn ngữ khác mà không cần ( có thì càng tốt ) đảm bảo chất lượng của nội dung truyện. Từ, cấu trúc, ngôn ngữ…vẫn giữ lại đặc đặc điểm của ngôn ngữ cần convert. Nói gọn lại nó là Chuyển Ngữ sang ngôn ngữ mình hiểu.
2. Làm thế nào để convert?
Hiện nay có rất nhiều chương trình convert nhưng phổ biến nhất thì có hai loại. Đó là Chinese Conbert Pro (CCP) và Quick Translator.
Thông dụng nhất và được phần lớn các converter sử dụng hiện nay là chương trình Quick Translator. Ở đây mình sẽ hướng dẫn các bạn sơ qua vể chương trình này và 1 số thao tác chủ yếu để convert từng chương truyện cũng như convert 1 bộ truyện hoàn chỉnh!
*Chú ý: Để có thể sử dụng các phần mềm này, máy của các bạn bắt buộc phải có cài chương trình NET Framework 3.5 và cài font tiếng Trung trong máy
Có thể download phần mềm Net Framework 3.5 tại đây: http://www.microsoft.com/en-us/download/details.aspx?id=22
3. Cách convert.
Để tiện lợi mình sẽ đưa bản Quick Translator của mình lên để các bạn tham khảo.
Link down : http://www.mediafire.com/?8kdf4bbj0box9fn
Các bạn giải nén ra sẽ thấy 1 khung hình như sau:
61bf0fa6f84150a8d932b4e7819488ad_49390027.qt.jpg


Các file quan trọng cần chú ý sẽ là:
  1. Name.txt
  2. Vietphrase.txt
  3. QuickTranslator
  4. QuickConverter
  5. QuickAnalyzer
  6. QuickVietPhraseMerger
Hai file đầu là file data, là huyết mạch của mỗi converter. Muốn có bản convert đẹp thì hoàn thiện data mỗi ngày là không thể thiếu. Có bạn từng hỏi: Sao bạn convert chương truyện này 5p đã xong mà tớ làm 15 phút cũng không được như bạn? Đó là nhờ data họ tốt!

I - Đặc điểm của từng file

1 - File name.txt
Đây là file được lưu dưới dạng txt, dùng để lưu giữ và update các tên, chiêu thức, linh thú, danh sơn...của truyện. Nếu bộ name của bạn phong phú thì quá trình convert sẽ rất nhanh vì bạn không phải edit nhiều.

3ae57d8ef44c4979d3b4c7d339399a17_49394081.name.jpg


Để hoàn thiện file name có hai cách update là thủ công và tự động. Thủ công là khi convert từng chương bạn thấy có tên hay địa danh mới thì copy phần tiếng Trung và viết TV viết hoa vào file name.
Còn tự động bạn có thể tham khảo hướng dẫn của Lana bên TTV:
Muốn Edit Names hay từ vietphrase mới thì Bôi đen từ cần/muốn update click chuột phải hiện ra một cái bảng cho mình chọn muốn update cái gì
picture.php

Thí dụ : update names chẳng hạn !
Sau đó click chuột vào Update Name nó lại hiện ra một bảng khác :
picture.php


Bạn muốn viết hoa hay sửa chữa gì đều được.

Từ chưa có trong data thì chọn nút Add , nếu có rồi mà muốn thay đổi thì chọn Update , Muốn xóa thì chọn Delete

2 - File Vietphrase.txt
Là nơi lưu trữ các cấu trúc từ, cũng bao gồm cả name luôn.
Ví dụ: ngã môn = ta nhóm ( đám bọn họ) khi chỉnh lại sẽ là chúng ta
Update file này thường là thủ công khi trong quá trình cv thấy có nhiều cấu trúc từ không hay và mạch lạc.

Cả 2 file này đều được lưu ở dạng Encoding UTF - 8

3- QuickTranslator

Đây là chương trình mà các converter hay dùng nhất, dùng để convert các chương lẻ trong truyện. Các dịch giả cũng hay dùng để dịch truyện vì nó có vp, hv, và cả từ điển kèm theo!

Khi mở file QuickTranslator ở trong file đầu tiên sẽ có dạng

256cf2c25e2be377b9de05e0f64a7688_49394886.qt1.jpg


Nhiệm vụ của các bạn sẽ là copy 1 doạn txt tiếng trung và làm theo hướng dẫn sau:

70cb303a85939ed473ab6e03fe9088cc_49395209.qt2.jpg


1. Kích vào phần Translate From Clipboad nó sẽ hiện lên cái bảng trên ( mình lấy 1 chương TCTG làm thử)
2.Bên trái có hai phần, kích vào Hán việt sẽ ra txt hán việt, kích vào TTrung sẽ ra txt trung
3.Bên phải có 3 phần
-vp : ít dùng
-vp 1 nghĩa: cvter thường dùng cái này
-Quick Web: Các bạn có thể xem 1 trang web tiếng trung bằng ngôn ngữ VP

4 - QuickConverter

Chủ yếu là dùng để convert các file truyện có dung lượng lớn, gọi nôm na là file gộp!
Khi mở QC sẽ có dạng:

894ea194124bbd1030c6ad64f71524ba_49395673.qc.jpg


Để sử dụng chương trình này các bạn phải down txt trung rồi cho vào 1 folder nào đó ( A )
1. Thư mục nguồn, kick vào tìm đến A
2. Thư mục ra sản phẩm, thường có dạng A_QuickConverter
3. Các định dạng: QC có 6 định dạng nhưng thường chỉ sử dụng 3-4 định dạng thôi. Phổ biến nhất là Vp cho độc giả, HV cho độc giả, dạng cột cho dịch giả. Dạng Trung (TXT) cũng thỉnh thoảng sử dụng vì khi down txt cả cục nó sẽ ra định dạng mình không đọc được.

Sau khi chọn xong định dạng, bấm Run mà ngồi đợi sản phẩm thôi!

Rất dễ phải không các bạn!

Có time mình sẽ chia sẻ kinh nghiệm lấy txt ở 1 số trang thông dụng như qidian, book.zongheng. kenwen...và cả những trường hợp đi tìm txt nữa!

Bài hướng dẫn video:

Thêm cái này nữa cho dễ hiểu
[FLASH]http://www.youtube.com/v/cp3hvf7R3ag&feature=player_detailpage[/FLASH]
 

huyen2207

Luyện Khí Trung Kỳ
Ngọc
255,75
Tu vi
34,00
Cách lấy txt chương lẻ nhanh nhất cho các bộ truyện ra đều hiện nay là vào trang http://tieba.baidu.com/index.html
bf801ac6849b2d738ada642cfc2f78c1_49396457.tb.jpg


Các bạn chỉ việc copy tên TT vào rồi search là xem có chương mới hay không, ví dụ như Kiếm Đạo Độc Tôn:
a8d2124a756bfad2719862c098b4b5f6_49396991.tb1.jpg

Như vậy là đã có chương 732, chỉ việc kick vào copy txt và cv như trên!

Ngoài ra các trang web trung khác đều cho lấy txt, nhưng chỉ là phần chưa vào Vip ( lên khung). Trừ trang kenwen.com là mình thấy không có vip và tổng hợp rất nhiều truyện từ các trang như qidian.com, book,zongheng.com, 17k.com...đặc biệt là qidian.com thì up hầu hết các đầu truyện luôn!
Ví dụ nha, vẫn truyện trên:
Đây là trang chủ kenwen:
07675f7beac439d80e32e674d3ae0491_49397265.kw.jpg

Copy tên truyện vào phần tìm sẽ ra truyện của mình

cb338621b18825e67ed6a670e3e038df_49397680.kw1.jpg


Thấy chỗ chương mới chưa, kick vô đó rồi copy txt cv thôi :anhday:

* Về làm file gộp mình cũng hay lấy txt từ kenwen. Xem hình trên, số 1 sẽ là chỗ lấy txt cả bộ, bên cạnh phải sẽ là txt từng chương. Kick vào đó!

Hiện lên trang mới

fd44cbad0339695b613c249d1817b344_49398022.kw3.jpg

Kick vô 1 hoặc 2 rồi đợi txt thôi.

Qidian, zongheng lấy txt chỉ được phần chưa vip thôi nên có bộ nào chưa vip thì down trong đó cũng được!

Tạm xong, mong giáo chúng đều là converter của BNS!
 

huyen2207

Luyện Khí Trung Kỳ
Ngọc
255,75
Tu vi
34,00
Các ngươi vào thực tập đi nào, trình độ sư phạm có hạn nên trình bày lộn xộn. Có gì không hiểu cứ pm hỏi nha!

Xin cái post này của cô Huyền nhé.

Vấn đề

Kinh nghiệm tìm & lấy truyện Trung Quốc
Vấn đề 1: Lấy chương lẻ hàng loạt
Mỗi chương lẻ sau khi lấy về là một file riêng biệt, sử dụng QuickConverter có thể lựa chọn gộp chương hay không gộp chương.
Công cụ: Offline Explorer
Link down: http://www.box.com/s/m6e82kx1fydsf5p02u1i
Nhược điểm: Phần mềm này có khả năng download toàn bộ một website về mà vẫn giữ nguyên cấu trúc site. Tuy nhiên do ở đây sử dụng để tải về từng truyện một nên trong quá trình thực hiện cần chú ý một số điểm (sẽ nói rõ ở phía dưới). Thêm nữa cần chú ý rằng: để QuickConverter có thể convert được file đã tải về thì file đó phải có đuôi .htm hoặc .html, đồng thời – sau khi convert nên kiểm tra xem có thiếu chương nào không.

Để dễ hình dung, mình xin minh họa trực tiếp bằng một quá trình nhé, bỏ qua phần cài đặt chương trình, chương trình ở phía trên ở dạng Portable, khi cài mọi người nên nhớ đường dẫn đã chọn để cài đặt và tốt nhất nên tạo một shortcut ra Desktop nếu như dùng thường xuyên.

Lấy ví dụ trực tiếp bằng truyện Tiên Hồi của huynh Tìm về thực tại:
Tên truyện: 仙徊
Link: http://www.wanshuba.com/Html/8/8810/List.html
Thao tác 1: Copy link trên.
Chú ý: Link được copy phải tương tự như link trên, có nghĩa đó là link dẫn tới trang mục lục (trang đưa ra danh sách các chương, và chỉ cần nhấn vào tên một chương bất kỳ là có thể đọc được nội dung chương đó).

Thao tác 2: Mở chương trình Offline Explorer lên.
Chú ý: Hướng dẫn được thực hiện trên giao diện ribbon (mặc định của chương trình)
Thông thường hộp thoại New Project Wizard sẽ hiện lên và tự động bắt link bỏ vào vị trí cần thiết, nếu không có như vậy, hãy nhấn nút Project Wizard…
Kết quả như sau:
Step1.png


Nhấn Next > để tiếp tục
Step2.png

Ở đây mình muốn giải thích một điểm như sau: Con số mặc định trong hộp thoại Levels limit: hiện đang để là 1, chúng ta sẽ để nguyên như vậy và tiếp tục nhấn Next >, về ý nghĩa thì con số đó có ý nghĩa rằng: Link trang ban đầu chúng ta nhập vào được quy định là Level 0, bên trong trang đó có 1 số link (đa phần dẫn tới các trang chứa nội dung các chương) và các link được chứa trực tiếp trong trang Level 0 này được quy định là Level 1. Việc để Levels limit là 1 có nghĩa là chúng ta chỉ tải về nội dung của link Level 1 ấy thôi mà không tiếp tục mở các link (nếu có) trong link Level 1 ấy nữa.
Rồi, xong, chúng ta lại nhấn Next > để tiếp tục.
Step3.png


Trong hộp thoại này, chú ý phải chọn nút radio trước dòng: Skip loading the following file types: và tick hết các ô ở bên dưới ngoại trừ ô Graphics (images).
Thường thì nếu như một chương không có text mà thay vào đó là một file ảnh, ở phần cuối của tên chương sẽ có 1 chữ T (cái này mình thấy thế, cũng không chắc chắn đúng 100% đâu, nên sau khi Convert xong mọi người nên kiểm tra xem có đủ chương không và tiến hành bổ sung thủ công nếu cần).
Cụ thể trong ví dụ thì từ chương 129 trở đi là toàn file ảnh. Cái này lát nữa xử lý sau.
Rồi, tiếp tục nhấn Next >
Step4.png


Next > tiếp
Step5.png


Tiếp tục nhấn Next > và chương trình sẽ bắt đầu tải:
Step6.png


Sau khi tải xong, vào thư mục đã cài Offline Explorer, ở đó có một thư mục tên là Download. Bây giờ chú ý, link ban đầu chúng ta nhập vào là:
http://www.wanshuba.com/Html/8/8810/List.html
Cho nên đường dẫn vào nơi chứa file html sẽ là:
Download\www.wanshuba.com\Html\8\8810\
Đường dẫn chứa file ảnh (trong trường hợp này) là:
Download\www.wanshuba.com\DownFiles\Book\8\8810\
Có thể trực tiếp convert bằng cách lấy đường dẫn ở đây cũng được, nhưng tốt nhất nên copy thư mục chứa file html (trong trường hợp này là thư mục 8810) sang một nơi khác, Ở ngay ngoài ổ C chẳng hạn.

Thao tác 3: Chỉnh sửa thiết lập của QuickConverter (chỉ cần làm 1 lần cho mỗi trang)
Đầu tiên là mở thư mục chứa chương trình QuickConverter lên, trong đó sẽ có 3 file quan trọng:
HtmlChapterContentTags.config
HtmlChapterTitleTags.config
HtmlRemovedTags.config

Mở 3 file này bằng một chương trình sửa text bất kỳ, chẳng hạn ở đây là Notepad++ với thiết lập là Encode in UCS-2 Little Endian (Cho phép hiển thị tiếng Trung đúng)
Tiếp đó, mở một file html chứa truyện bất kỳ, chẳng hạn ở đây mình mở file 3167111.html trong đó chứa chương truyện số 1 tên là 第1章 梦回.
Step8.png

Mình cũng đồng thời mở file html này bằng trình duyệt nữa, và copy tên truyện này, sau đó bỏ vào Notepad++ để search.
Step9.png

Tới đây mọi người chú ý, kết quả có thể sẽ ra rất nhiều, tuy nhiên chúng ta cần tìm đúng cụm đó (và chỉ cụm đó thôi), đặc điểm dễ nhận thấy nhất là nó nằm giữa hai dấu > <, như thế này: >第1章 梦回<
Step10.png

Copy từ dấu > ở phía trước tên chương truyện (tức là từ trước chữ第 trong cụm vừa tìm ở trên) cho tới khi nào gặp dấu < đầu tiên, ở đây sẽ là copy cụm: <div class="title"> (Thường cụm này sẽ có chữ title)
Nếu có ai học lập trình chắc sẽ biết cái cụm phía trên được gọi là một ‘tag’ (mình ko học :)))
Vậy là được một ‘tag’ đánh dấu tên chương truyện nhé. Giờ chúng ta sẽ dán nó vào trong file HtmlChapterTitleTags.config:
Thêm cụm sau vào cuối file:
# http://www.wanshuba.com
<div class="title">


Hình như trong lập trình C cái dấu # kia nó chỉ dùng cho chú thích thôi nên chắc không có tác dụng gì, nhưng ở phía trên cũng làm như thế, thêm nữa không hiểu + đằng nào cũng để đánh dấu xem trang nào mình đã thiết lập setting rồi nên mình để nguyên :).
Làm tương tự với file HtmlChapterContentTags.config
và file HtmlRemovedTags.config nhé,
với HtmlChapterContentTags.config thì sẽ là tag mà ngay sau đó là nội dung chương truyện, còn HtmlRemovedTags.config là những cụm nào mọi người muốn xóa (quảng cáo chẳng hạn, như kiểu – Truyện … được copy từ …) ấy ấy :)).
Sau khi chỉnh sửa xong mọi người nhớ nhấn Ctrl+S để lưu file lại nhé.

Thao tác 4: Dùng QuickConverter để convert truyện.
Bước này chắc mọi người đều biết rồi, nên mình không hướng dẫn nữa, chỉ chú ý một chút là nếu chọn convert từ thư mục nào, thì thư mục đó chỉ nên chứa những thứ cần convert thôi, QuickConverter nhận diện cả file htm/html và txt nên không có vấn đề gì. Nhưng nếu lựa chọn gộp file thì không nên để nhiều truyện vào cùng một thư mục nhé. Thêm nữa là nên chọn chế độ đổi lại tên file thành 001, 002,…


#Phụ lục 1: Một số mẹo khi tìm & down file text
1 là nên để ý có nhiều trang cho phép down text đầy đủ mà không cần phải đăng nhập, chẳng hạn:
http://wvw.ranwen.com
http://www.bxwx.org
2 là nếu search google mà cần tìm text thì nhớ thêm cụm dưới đây vào sau tên truyện
TXT 下载
3 là khi trỏ chuột vào link down, nên để ý xem tên file down về có đuôi là .txt hay không rồi hẵng down.


Còn một tí tẹo mẹo vặt nữa, để update sau, mệt quá, mất 2 tiếng để viết cái bài này :petrified:
Hôm nay em mới được ngủ có 4 tiếng :026:
 

huyen2207

Luyện Khí Trung Kỳ
Ngọc
255,75
Tu vi
34,00
Gộp một số bài viết hay

Box đào tạo xin cái link của pic này cô Huyen nhé.

:c10: Các thứ trên hơi dài dòng, chỉ cần dẫn link dow QT, sau đó hướng dẫn các điểm sau:

- Sử dụng QT: Ấn vào biểu tượng; Coppy text, sau đó ấn vào Translate from clipbroad. Xong

- Edit tên, Edit VP.

- Sử dụng Baike - ing

- Lấy text: các dạng đầy đủ.

:c10: Đây là em lấy kinh nghiệm từ bản thân thôi - một đứa vật lộn mãi mới biết dùng QT.

Đây, một chút kinh nghiệm dùng QT của em (Hơi nặng về dịch):

- QT sẽ mặc định lấy nghĩa thứ nhất trong bảng nghĩa để hiển thị, vì thế đôi khi nghĩa được chọn sẽ không phù hợp bằng nghĩa thứ hai, ba...vv Nếu edit thì không hợp lý, có một cách là các bạn đưa nghĩa chính xác đó lên đầu. Bên cạnh đó, trong QT thường có các nghĩa lặp một cách vô duyên, ví dụ thế này: hàng/lối/ hàng lối/ lối/ hàng... Các bạn cũng nên xóa bớt các từ trùng cho gọn.

- Khi gặp một từ ghép, cụm từ không rõ ràng, bạn nên sử dụng chức năng Baike - ing để dò tìm nghĩa. Cái này khá tốn time, đầu tiên là bôi đen từng chữ, rồi hai chữ, ba chữ (ba chữ đầu, ba chữ cuối ...vvv) -> ấn chuột phải, chọn Baike -ing :c20:

Thêm cái này nữa cho dễ hiểu
[FLASH]http://www.youtube.com/v/cp3hvf7R3ag&feature=player_detailpage[/FLASH]

Cũng hơi rảnh rảnh nên nói sơ qua về qidian nha! Chứ muốn lấy link thì cứ copy tên truyện là ra hàng loạt!

Đây là giao diện. Chú ý là web này giao diện dài lắm nên cắt phần đầu thôi.
fec011cd570e41bec6a0a150a0dc469a_49683070.1.jpg


Cái dòng mình chỉ vào là các thể loại truyện. Thể lọa ưa chuộng bây giờ là huyền huyễn và tiên hiệp!


9dbbec2bbef244a411ee7a12536b546a_49683302.2.jpg


1 - truyện vào vip
2 - Huyền huyễn kỳ huyễn
3- Võ hiệp tiên hiệp

Thường những truyện chất lượng nhanh lên khung ( Vip) nhất. Mấy cái còn lại các bạn tự dò cũng được!

Tìm theo từng thể loại cũng được vì mỗi truyện đều có phiếu đánh giá hết! Ví dụ kick vào truyện vip nhé ( số 1)

Đây là phần mới vào vip, đều có phiếu tháng ở bên cạnh.

3f62f52fa6994492ad535e513f515eff_49683492.3.jpg


Kéo xuống tiếp nha!

ec4ea900c7441cff412f0f8f37d5eafd_49683720.4.jpg



Đây là list các truyện hot nhất của qidian, mọi người có thể chọn. Kick vào mũi tên sẽ ra top 50, top 100...

Truyện mới ra thì nhanh nhất là tìm theo thể loại, như Tiên hiệp nha!

bd90686dbe5054abb4293e14bbfd6ace_49684093.5.jpg


Kéo xuống, ở tầm giữa trang bên tay phải là danh sách truyện và phiếu!

Còn lấy txt ở qidian thì dễ lắm, nhưng chỉ dành cho chưa vào vip thôi! Phần vào vip không lấy được đâu, nhưng chỉ cần copy tên truyện vô kenwen lấy txt. Cái này nói trên rồi.

Ví dụ PNTT nha!


b32a73340878148f4a297418287a8da5_49684382.6.jpg


Ở link truyện sau từ book đánh thêm reader vào!

Như vậy (1)

938a9b765a29bf436df936693d5d36f2_49684576.7.jpg


Lấy txt kick vào chữ màu xanh ở 2 thôi!

Mình sư phạm kém lắm, viết linh tinh, ai hệ thống lại dùm nha!
 

VôHưKhông

Phàm Nhân
Ngọc
1.516,04
Tu vi
0,00
Dành cho người chưa biết mà, dài thì học mới dễ, chứ mi nhắm mắt cũng làm được :mayhabuoi:

Quên, ai có kinh nghiệm hay chiêu thức nào hay xin bổ sung nha! :camon:

:nhamhiem: Em mới biết dùng gần đây thôi, hồi trước cũng đi đọc mấy bài dài thế này mà có dùng được đâu.

CV cả cục chưa biết đây này, chỉ Cv từng chương.

Hướng dẫn lấy text đi ca.
 

minhmang83

Phàm Nhân
Ngọc
50,35
Tu vi
0,00
Đúng chi tiết càng tốt :hoa: mem càng hiểu, như mình dùng soft hay ngịch nhưng vẫn muốn chi tiết cho chắc ăn

Mà nghe nói win7 thì ko cần cài framework 3.5 hẻ huyền :khockhoc:
Dành cho người chưa biết mà, dài thì học mới dễ, chứ mi nhắm mắt cũng làm được :mayhabuoi:

Quên, ai có kinh nghiệm hay chiêu thức nào hay xin bổ sung nha! :camon:
 
T

Tịch Địa

Guest
Khổ nhất là txt dính pinyin, thứ 2 là giờ toàn chèn những từ vô nghĩa như mão, đa, ác...cái này pó chiếu chưa tìm được cách. Chỉ biết mí từ này nó hay đi với 1 số cụm từ cụ thể nên chỉnh hết trong vietphrase!

Em toàn dính txt dỏm kiểu dính pinyin, ngồi mò nghĩa với đoán bậy tùm lum hết :(
 

Những đạo hữu đang tham gia đàm luận

Top