Lọc dữ liệu trùng nhau từ 2 cột trong excel

-

Cách so sánh hai cột dữ liệu trong Excel để xóa, highlight, tô màu dữ liệu trùng lặp là một trong những câu hỏi đang được rất nhiều bạn quan tâm cũng như gửi câu hỏi về cho chúng tôi. Với bài viết này, curvesvietnam.com học excel cơ bản online sẽ hướng dẫn các bạn cách so sánh hai cột Excel trùng lặp và xóa hoặc highlight những phần trùng lặp được tìm thấy.

Bạn đang xem: Lọc dữ liệu trùng nhau từ 2 cột trong excel

*

Excel là một ứng dụng rất mạnh và thực sự tuyệt vời để tạo và xử lý các mảng dữ liệu lớn. Bây giờ, bạn có rất nhiều bảng tính và dữ liệu, hoặc có thể chỉ là một bảng tính rất lớn, bạn muốn so sánh 2 cột để tìm các giá trị trùng lắp và thao tác trên những phần lặp được tìm thấy, ví dụ xóa hàng bị trùng, tô màu phần trùng hoặc xóa nội dung của ô bị trùng. Hai cột này có thể nằm trong một bảng, liền kề hoặc không liền kề, hoặc chúng có thể nằm trong 2 trang tính khác nhau, thậm chí là hai bảng tính khác nhau.

Giả sử bạn có 2 cột tên người – 5 tên trong cột A và 3 tên trong cột B. Bạn muốn so sánh dữ liệu giữa hai cột này để tìm các tên bị trùng lắp. Đây chỉ là ví dụ. Trong các bảng tính thực, dữ liệu để so sánh thường có hàng ngàn, hàng vạn mục.

Trường hợp A: Cả hai cột đều trong một trang tính, cùng một bảng dữ liệu: Cột A và cột B.

*

Trường hợp B: Hai cột được đặt trên hai trang tính khác nhau: cột A trong Sheet2 và cột A trong Sheet3.

*


Xem nhanh


*

So sánh hai cột để tìm giá trị trùng bằng công thức:

Trường hợp 1: cả hai cột cùng một danh sách

Trong ô trống đầu tiên, ô C1, nhập công thức: =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),”Unique”,”Duplicate”)

*

Trong công thức, A1 là ô đầu tiên của cột đầu tiên mà chúng ta muốn sử dụng để so sánh. $B$1$B$10000 là địa chỉ của ô đầu tiên và cuối cùng của cột thứ hai mà bạn muốn so sánh. Hãy chú ý cố định tham chiếu ô – ký hiệu đô la ($) trước các ký tự cột và số hàng. Tôi sử dụng tham chiếu tuyệt đối nhằm giữ nguyên địa chỉ ô khi sao chép công thức.

Nếu bạn muốn tìm các giá trị trùng trong cột B, hoán đổi tên cột như sau: =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),”Unique”,”Duplicate”)

Thay vì “Unique”/”Duplicate” (duy nhất/trùng lắp), bạn cũng có thể tự đặt nhãn cho mình như “Not found”/”Found” (Tìm thấy/Không tìm thấy) hoặc “Duplicate” và gõ “” thay vì “Unique”. Trong cách thứ hai, bạn sẽ có một ô trống kế bên ô mà giá trị trùng lắp không được tìm thấy.

Bây giờ hãy sao chép công thức vào tất cả các ô của cột C cho đến hàng cuối cùng có chứa dữ liệu trong cột A. Để làm điều này, đặt con trỏ vào góc dưới bên phải của ô С1, con trỏ sẽ chuyển thành một dấu thập phân đen như trong hình dưới đây:

*

Nhấn giữ chuột trái, kéo đường viền ô xuống để chọn tất cả các ô mà bạn muốn sao chép công thức vào. Khi tất cả các ô đã được chọn, thả chuột trái:

*

Chú ý. Trong bảng lớn, có một cách nhanh hơn để sao chép công thức là sử dụng phím tắt. Nhấp vào ô C1 để chọn nó và nhấn Ctrl + C (để sao chép công thức vào clipboard), sau đó nhấn Ctrl + Shift + End (để chọn tất cả những ô chứa dữ liệu trong cột C), cuối cùng, nhấn Ctrl + V (để dán công thức vào tất cả ô tính đã chọn).

Tất cả các ô chứa giá trị trùng đều được đánh dấu là “Duplicate”.

*

Trường hợp B: hai cột nằm trên hai trang tính (bảng tính) khác nhau.

Trong ô đầu tiên của cột trống đầu tiên trong Sheet2 (cột B), nhập công thức: =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),””,”Duplicate”)

Sheet3! là tên trang tính có chứa cột thứ 2, $A$1:$A$10000 là địa chỉ của ô tính đầu tiên và ô tính cuối cùng trong cột thứ 2.

Xem thêm: Rèm Cửa Đường Trường Trường Chinh Quận 12, Trường Thpt Trường Chinh

Tương tự như bước trong trường hợp A.Chúng ta có kết quả sau đây:

*

Xử lý các giá trị trùng lắp được tìm thấy:

Chúng ta đã tìm thấy những giá trị trong cột thứ nhất (cột A) cũng trùng với cột thứ hai (cột B). Bây giờ chúng ta cần làm vài thứ với chúng.

Thật không hiệu quả và tốn thời gian khi tìm kiếm trên toàn bộ bảng và xem xét từng giá trị trùng lắp một cách thủ công. Có nhiều cách thực hiện ưu việt hơn.

Chỉ hiển thị hàng bị trùng trong cột A:

Nếu cột của bạn không có tiêu đề, bạn cần thêm vào cho chúng. Để thực hiện điều này, đặt con trỏ chuột vào con số thứ tự đầu hàng (số 1), con chuột sẽ biển đổi thành mũi tên màu đen như trong hình dưới đây:

*

Nhấp phải vào hàng được chọn và chọn Insert từ danh sách tùy chọn:

*

Đặt tên cho cột, ví dụ “Name”, “Duplicate?”… Sau đó mở thẻ Data và nhấp chọn Filter:

*

Sau khi nhấp chuột vào mũi tên nhỏ màu xám kế bên “Duplicate?” để mở danh sách tùy chọn, bỏ chọn tất cả các mục ngoại trừ Duplicate trong danh sách đó, nhấn OK:

*

Như vậy, bạn chỉ thấy những ô tính trong cột A có chứa giá trị trùng lắp với cột B. Có 3 ô tính như vậy trong trang tính ví dụ.

*

Để hiển thị tất cả các hàng trong cột A lần nữa, nhấp vào biểu tượng filter trong cột B và chọn Select All. Hoặc, bạn có thể vào thẻ Data > Select & Filter > Clear như trong hình dưới đây:

 

*

Tô màu hoặc highlight những giá trị trùng tìm thấy:

Ngoài gắn nhãn “Duplicate”, bạn cũng có thể đánh dấu các giá trị trùng bằng một cách khác như định dạng màu chữ hoặc bôi màu nó.

Lọc các giá trị trùng lặp như giải thích ở trên, chọn các ô tính đã lọc và nhấn Ctrl + F1 để mở hộp thoại Format Cells. Ví dụ: hãy thay đổi màu nền của các hàng bị trùng sang màu vàng tươi. Tất nhiên, bạn có thể thay đổi màu nền của các ô này bằng cách sử dụng tùy chọn Fill color trên thẻ Home, nhưng ưu thế của hộp thoại Format Cells là nó cho phép bạn thực hiện tất cả các thay đổi định dạng cùng lúc.

*

Bây giờ, bạn sẽ không bỏ sót bất kỳ ô chứa giá trị trùng nào.

*

Loại bỏ giá trị trùng lặp từ cột đầu tiên:

Lọc bảng dữ liệu để hiển thị các giá trị trùng lặp, chọn tất cả những ô đó.

Nếu hai cột được so sánh nằm trên hai trang tính khác nhau, cụ thể là trong hai bảng dữ liệu riêng biệt, nhấp phải vào vùng dữ liệu được chọn và chọn Delete Row từ danh sách tùy chọn.

*

Khi Excel yêu cầu bạn xác nhận bạn có thật sự muốn xóa toàn bộ hàng này không, nhấn OK và bỏ bộ lọc. Như vậy, chỉ những hàng chứa các giá trị duy nhất được hiển thị:

*

Nếu hai cột nằm trên cùng một trang tính, hai cột liền kề hoặc không liền kề, việc xóa những giá trị trùng lắp sẽ phức tạp hơn. Chúng ta không thể xóa toàn bộ hàng chứa chúng bởi vì như vậy sẽ xóa những ô tương ứng trong cột 2. Vì vậy, để hiển thị những giá trị duy nhất trong cột A, thực hiện theo các bước sau:

Lọc bảng để các giá trị trùng lặp được hiển thị và chọn tất cả những ô đó. Nhấp phải vào vùng được chọn và chọn Clear Contents.

*

Bỏ bộ lọc.Chọn tất cả ô tính trong cột A bắt đầu từ ô A1 đến ô cuối cùng có chứa dữ liệu.Di chuyển đến thẻ Data, nhấp chọn Sort A to Z. Trong hộp thoại mở ra, chọn Continue with the current selection và nhấn Sort.

*

Xóa cột chứa công thức, chỉ để lại “Uniques”Như vậy, cột A chỉ còn những dữ liệu không bị trùng lặp trong cột B.

*