Xin cho hỏi cách chuyển Cơ sở dữ liệu từ TEXT qua EXCEL (2 người xem)

Liên hệ QC

Người dùng đang xem chủ đề này

tsuyoshi

Thành viên mới
Tham gia
22/12/07
Bài viết
7
Được thích
0
Xin chào các bạn;

Mình có một file dữ liệu tiếng Việt -Việt của anh Hồ Ngọc Đức.
Mình muốn chuyển từ dạng TEXT sang EXCEL để làm tự điển.

Xin cho mình hỏi cách chuyển file dữ liệu từ dạng text qua EXCEL thì làm sao?

File dạng text này có dạng

@từ mới - nghĩa từ 1 - nghĩa từ 2.....


Mình muốn là khi chuyển qua EXCEL như sau;

CỘT 1 CỘT 2
@từ mới nghĩa 1, nghĩa 2...... (tất cả vào 1 cell)



Xin các bạn hướng dẫn. Thành thật cảm ơn.

Đây là file từ điển 30.000 từ tiếng Việt đó.

http://ccc.domaindlx.com/Newstage/Stuff/Viet-viet.dic (File từ điển 30.000 từ)
http://ccc.domaindlx.com/Newstage/Stuff/testtiengviet.txt (file test, ít từ thôi, dùng để test)


Nếu bạn nào chuyển được thành công, xin gửi file EXCEL đó qua Email cho mình cũng được.
Địa chỉ Email: nobvn@yahoo.com

Cheers!!!
 
Mình muốn là khi chuyển qua EXCEL như sau;

CỘT 1 CỘT 2
@từ mới nghĩa 1, nghĩa 2...... (tất cả vào 1 cell)
Oh tốt nhất có lẽ là bạn cho thử nó vào 1 file excel (thủ công bằng tay) như mẫu bạn y/c rồi upload lên thử xem,? Vì thấy nó bông lung thế nào ý
.
 
Lần chỉnh sửa cuối:
tsuyoshi đã viết:
Xin chào các bạn;

Mình có một file dữ liệu tiếng Việt -Việt của anh Hồ Ngọc Đức.
Mình muốn chuyển từ dạng TEXT sang EXCEL để làm tự điển.

Xin cho mình hỏi cách chuyển file dữ liệu từ dạng text qua EXCEL thì làm sao?

File dạng text này có dạng

@từ mới - nghĩa từ 1 - nghĩa từ 2.....


Mình muốn là khi chuyển qua EXCEL như sau;

CỘT 1 CỘT 2
@từ mới nghĩa 1, nghĩa 2...... (tất cả vào 1 cell)



Xin các bạn hướng dẫn. Thành thật cảm ơn.

Đây là file từ điển 30.000 từ tiếng Việt đó.

http://ccc.domaindlx.com/Newstage/Stuff/Viet-viet.dic (File từ điển 30.000 từ)
http://ccc.domaindlx.com/Newstage/Stuff/testtiengviet.txt (file test, ít từ thôi, dùng để test)


Nếu bạn nào chuyển được thành công, xin gửi file EXCEL đó qua Email cho mình cũng được.
Địa chỉ Email: nobvn@yahoo.com

Cheers!!!
Gần như là không tưởng, dữ liệu dạng text xếp theo hàng, không đồng nhất về số hàng (nói chung là rất lộn xộn)
 
Các bạn hãy dùng chức năng import trong ASAP UTILITIES 4.1.1.

Thân.
 
Thien đã viết:
Các bạn hãy dùng chức năng import trong ASAP UTILITIES 4.1.1.

Thân.
Bạn có thể hướng dẫn chi tiết được không, nhất là trong trường hợp này, nhân tiện mình up cái files dữ liệu lưu trong file Word lên, bạn chuyển thành file Excel theo yêu cầu của tác giả nhé. Thanks!
 

File đính kèm

Trong Word chọn Ctrl+A sau đó kẻ bảng table . Trong bảng chọn Copy . Xuất sang EXCEL chọn Paste .
 

File đính kèm

kongcom đã viết:
Trong Word chọn Ctrl+A sau đó kẻ bảng table . Trong bảng chọn Copy . Xuất sang EXCEL chọn Paste .
Oh không được rồi Kongcom ơi, dữ liệu yêu cầu phải sắp xếp theo cột cơ mà. Theo kết quả của bác thì cứ Ctrl+A và Pates thẳng vào cell A1 cũng ra thôi.
 
Dĩ nhiên là làm được, nhưng với file text bạn phamnhukhang gửi lên thôi, còn với một dữ liệu chừng 30.000 từ như tác giả nói thì... e rằng đây là chuyện không tưởng...

Thôi thì cũng trình bày các làm ra đây, các bạn cứ xem thử nhé, rồi còn làm nổi hay không thì tùy...

1. Convert text to table trong Word
Do cấu trúc của dữ liệu là theo hàng ngang, nên phải chuyển khối lượng text này sang dạng bảng trước khi dán vào Excel.

Để ý kỹ chút, tác giả dùng dấu @ để đánh dấu mục từ, do đó, khi convert sang dạng bảng, phải lợi dụng cái dấu @ này:

Chọn hết file Word (Ctrl-A), rồi gọi lệnh Table | Convert | Text to Table:
Đánh dấu @ ở ô Other của phần Separate text at:
023.jpg

Bạn sẽ được một cái table có hình dạng như sau:
024.jpg

2. Copy và Paste sang Excel
Bây giờ, paste lần lượt vào Excel.

Chọn hết cột bên phải (cột chứa mục từ), copy, rồi dán vào ô B1 bên Excel
(bạn dán vào A1 cũng được, nhưng nên chừa lại một cột A, lỡ có cần chuyện gì về sau)
Sau đó chọn hết cột bên trái (của Word), copy rồi paste vào ô C1 bên Excel

Hình dạng bên Excel sẽ đại khái như sau:
025.jpg

3. Xóa hàng trắng
Bạn để ý nhé, có những hàng như 9, 12, 15, 18, v.v... là những hàng trắng trơn... Ta phải bỏ đi, để ngó cho được được chút.

Dùng Auto Filter, lọc hết những hàng "blank" của cả hai cột B và C, xóa đi. Bi giờ thì trông đỡ hơn rồi:
026.jpg

4. Sắp xếp mục từ và phần giải nghĩa
Vấn đề bi giờ là, ứng với từ ở B1, giải nghĩa lại nằm ở C2... Làm sao cho nó nhảy lên C1 ? Dễ ợt, bạn xóa phén cái C1 đi, khi Excel hỏi là xóa xong làm gì, bạn nói nó đôn hàng dưới lên trên (Shift cell up).

Nó lại lòi ra một số hàng trống giữa từng mục từ... Để yên vậy cũng được, cho nó phân cách mục từ rõ ràng, còn nếu không thích, thì xóa đi, giống như đã làm ở bước 3, như hình sau:
027.jpg

Vấn đề còn lại là, ứng với mỗi mục từ của cột B, thì có giải nghĩa bên cột C, nhưng phần giải nghĩa này có khi nằm ở hai, ba hàng...

Chẳng lẽ phải "merge" nó lại nữa sao?


Thú thật, làm tới đây thì tôi đã oải lắm rồi, mong có bác nào tiếp sức với...

 
Và đây là kết quả files làm bằng công thức của tôi, các bạn xem còn thiếu sót thì bổ sung thêm hộ nhé.
 

File đính kèm

Chuyển file text qua Excel

Bạn dùng file gửi kèm theo để thực hiện chuyển.
Tôi dùng VBA để thực hiện.

Theo cấu trúc file kèm theo
1. Copy toàn bộ nội dung file Text qua cột B (từ B2) của Excel
2. Trên A2 nhập công thức như sheet B1, copy công thức cho tất cả các hàng còn lại.
3. Nhấn Ctrl+q để chương trình thực hiện chạy nhập dữ liệu các ô lại với nhau.

Ghi chú: Tôi chưa xử lý cho trường hợp số dòng > 65536 và số ký tự > 1024.

Chào.
 

File đính kèm

@DotNhan: Rất hay! Coi cái của bạn xong chỉ muốn xóa hết bài của tui, hic...
Có điều... bạn ơi, cho xem code tí đi, là tui hỏi cái password để xem í mà...
 
Mình sửa lại và gộp tất cả các giải nghĩa từ vào một cell theo đúng ý tác giả, dung lượng files giảm và tốc độ tăng đáng kể. Có thể nhét cả bộ từ điển vào được. Nếu bộ từ điển khoảng 30 nghìn từ chỉ lấy phần dữ liệu bằng cách copy/pate special... thì dung lượng files khoảng 3.2 mb.
 

File đính kèm

Xin thành thật cảm ơn các bạn đã rất nhiệt tình giúp mình.

Mình sẽ thử làm theo cách các bạn hướng dẫn.

Mình chưa làm thử, nhưng đọc thì thấy khả quan lắm.

Xin cám ơn.
 
Thông cảm nhen.
Mình hiểu lầm ý các bạn rùi.
Nếu đơn giản import dữ liệu từ file txt vào Excel thì được. Xem file nhen.

Thân.
 

File đính kèm

Thien đã viết:
Thông cảm nhen.
Mình hiểu lầm ý các bạn rùi.
Nếu đơn giản import dữ liệu từ file txt vào Excel thì được. Xem file nhen.

Thân.
Nếu kết quả ra đúng như file ví dụ của bác thì ...Import với Export làm gì cho mệt, Ctrl+A, copy và pate một nhát vào ô A1 là xong
 
Mình đã làm theo hướng dẫn của anh/chị DotNhan và đã được file như ý muốn.

Rất cám ơn anh/chị DotNhan và các bạn đã quan tấm giúp đỡ.

Phải nói thật, mình thấy EXCEL nó thật là EXCELLENT!
Nếu biết tận dụng thêm kĩ năng VBA thì hay biết mấy!

Chắc phải học VBA gấp quá!

Thank you các bạn nhiều.
 
Đây là file mà mình đã convert, bạn xem thử đã đúng với ý bạn chưa nhé.
 

File đính kèm

Lần chỉnh sửa cuối:
Bạn Dotnhan có thể cho mình pass để xem được không? (duckyhut@gmail.com)
 
Bạn dùng file gửi kèm theo để thực hiện chuyển.
Tôi dùng VBA để thực hiện.

Theo cấu trúc file kèm theo
1. Copy toàn bộ nội dung file Text qua cột B (từ B2) của Excel
2. Trên A2 nhập công thức như sheet B1, copy công thức cho tất cả các hàng còn lại.
3. Nhấn Ctrl+q để chương trình thực hiện chạy nhập dữ liệu các ô lại với nhau.

Ghi chú: Tôi chưa xử lý cho trường hợp số dòng > 65536 và số ký tự > 1024.

Chào.

Em co mot file text tuong tu nhu the nhung dang la"

[TABLE="width: 421"]
[TR]
[TD="align: left"]北斗七星月光舞=Bắc Đẩu Thất Tinh Nguyệt Quang Vũ[/TD]
[/TR]
[TR]
[TD="align: left"]冰雪女神的叹息=Băng Tuyết Nữ Thần Đích Thán Tức[/TD]
[/TR]
[TR]
[TD="align: left"]阿娜丝塔西亚=Anastasia[/TD]
[/TR]
[TR]
[TD="align: left"]降魔金刚法力=Hàng Ma Kim Cương Pháp Lực[/TD]
[/TR]
[TR]
[TD="align: left"]克蕾奥帕特拉=Cleopatra[/TD]
[/TR]
[TR]
[TD="align: left"]烈火天罡剑诀=Liệt Hỏa Thiên Cang Kiếm Quyết[/TD]
[/TR]
[/TABLE]


Em đã làm theo anh chị hướng dẫn và đổi công thức thành:

=IF(LEFT(B2,1)="=",B2,A1)

Nhưng nó lại không xắp xếp lại dữ liệu thành hai cột được. Có anh chị nào chỉ bảo cho em cách làm không ạ.
Em muốn chuyển thành
Cột A: Tiếng Trung
Cột B: Tiếng Việt

thanks anh chị nhiều nhiều
 
Web KT

Bài viết mới nhất

Back
Top Bottom