Vẽ Biểu Đồ Scatter Plot bằng Seaborn

10 Tháng ba, 2025 By admin 0

Biểu đồ phân tán

Biểu đồ phân tán có thể được sử dụng với một số nhóm ngữ nghĩa có thể giúp hiểu rõ hơn trong biểu đồ. Chúng có thể vẽ đồ họa hai chiều có thể được cải thiện bằng cách ánh xạ tối đa ba biến bổ sung trong khi sử dụng ngữ nghĩa của các tham số sắc thái, kích thước và kiểu. Tất cả các tham số đều kiểm soát ngữ nghĩa trực quan được sử dụng để xác định các tập hợp con khác nhau. Sử dụng ngữ nghĩa dự phòng có thể hữu ích để làm cho đồ họa dễ tiếp cận hơn.

Cú pháp: seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, alpha=’auto’, x_jitter=None, y_jitter=None, legend=’brief’, ax=None, **kwargs)
Tham số:
x, y: Biến dữ liệu đầu vào phải là số.

dữ liệu : Khung dữ liệu trong đó mỗi cột là một biến và mỗi hàng là một quan sát.

size : Biến nhóm sẽ tạo ra các điểm có kích thước khác nhau.

style : Nhóm biến sẽ tạo ra các điểm có các điểm đánh dấu khác nhau.

bảng màu : Biến nhóm sẽ tạo ra các điểm có điểm đánh dấu khác nhau.

điểm đánh dấu : Đối tượng xác định cách vẽ điểm đánh dấu cho các cấp độ khác nhau.

alpha : Độ mờ tương ứng của các điểm.

Trả về: Phương pháp này trả về đối tượng Axes có đồ thị được vẽ trên đó.

Tạo biểu đồ phân tán

Hãy hình dung tập dữ liệu “fmri” bằng hàm seaborn.scatterplot(). Chúng ta sẽ chỉ sử dụng các tham số x, y của hàm.

Mã số:

 

 

 

import seaborn
seaborn.set(style='whitegrid')
fmri = seaborn.load_dataset("fmri")
seaborn.scatterplot(x="timepoint",
                    y="signal",
                    data=fmri)

Đầu ra:

Nhóm các điểm dữ liệu theo danh mục, ở đây là khu vực và sự kiện.

 

 

 

import seaborn
seaborn.set(style='whitegrid')
fmri = seaborn.load_dataset("fmri")
seaborn.scatterplot(x="timepoint",
                    y="signal",
                    hue="region",
                    style="event",
                    data=fmri)

Đầu ra:

Hình ảnh cơ bản của tập dữ liệu “mẹo” sử dụng Scatterplot.

 

 

 

import seaborn
seaborn.set(style='whitegrid')
tip = seaborn.load_dataset('tips')
seaborn.scatterplot(x='day', y='tip', data=tip)

Đầu ra:

Nhóm các biến trong Seaborn Scatter Plot với các thuộc tính khác nhau

1. Thêm các thuộc tính đánh dấu

Vòng tròn được sử dụng để biểu diễn điểm dữ liệu và điểm đánh dấu mặc định ở đây là vòng tròn màu xanh. Trong đầu ra ở trên, chúng ta đang thấy đầu ra mặc định cho điểm đánh dấu, nhưng chúng ta có thể tùy chỉnh vòng tròn màu xanh này bằng các thuộc tính điểm đánh dấu .

 

 

 

seaborn.scatterplot(x='day', y='tip', data= tip, marker = '+')

Đầu ra:

2. Thêm thuộc tính màu sắc.

Nó sẽ tạo ra các điểm dữ liệu với các màu khác nhau. Sắc thái có thể được sử dụng để nhóm nhiều biến dữ liệu và hiển thị sự phụ thuộc của các giá trị dữ liệu được truyền vào để được biểu diễn.

Cú pháp: seaborn.scatterplot( x, y, data, hue)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, hue='time')

Đầu ra:

Trong ví dụ trên, chúng ta có thể thấy tiền boa và hóa đơn ngày liên quan như thế nào đến việc đó là giờ ăn trưa hay giờ ăn tối. Màu xanh lam đại diện cho Bữa tối và màu cam đại diện cho Bữa trưa.

Chúng ta hãy kiểm tra màu sắc = ” ngày “

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, hue='day')

3. Thêm thuộc tính kiểu.

Biến nhóm sẽ tạo ra các điểm có các điểm đánh dấu khác nhau. Sử dụng style, chúng ta có thể tạo biến nhóm phân tán sẽ tạo ra các điểm có các điểm đánh dấu khác nhau.

Cú pháp:

seaborn.scatterplot( x, y, dữ liệu, kiểu)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, hue="time", style="time")

Đầu ra:

4. Thêm thuộc tính bảng màu.

Sử dụng bảng màu, chúng ta có thể tạo điểm với các màu khác nhau . Trong ví dụ bên dưới, chúng ta có thể thấy bảng màu có thể chịu trách nhiệm tạo biểu đồ phân tán với các giá trị bản đồ màu khác nhau.

Cú pháp:

seaborn.scatterplot( x, y, dữ liệu, bảng màu = “tên_màu”)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, hue='time', palette='pastel')

Đầu ra:

5. Thêm thuộc tính kích thước.

Sử dụng kích thước, chúng ta có thể tạo ra điểm và chúng ta có thể tạo ra các điểm có kích thước khác nhau.

Cú pháp:

seaborn.scatterplot( x, y, dữ liệu, kích thước)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip ,hue='size', size = "size")

Đầu ra:

6. Thêm thuộc tính chú giải.

.Sử dụng tham số legend, chúng ta có thể bật (legend=full) và chúng ta cũng có thể tắt legend bằng cách sử dụng (legend = False).

Nếu chú thích “ngắn gọn”, các biến số về màu sắc và kích thước sẽ được biểu diễn bằng một mẫu các giá trị cách đều nhau.

Nếu chú giải “đầy”, mỗi nhóm sẽ nhận được một mục trong chú giải.

Nếu Sai, không có dữ liệu chú giải nào được thêm vào và không có chú giải nào được vẽ.

Cú pháp: seaborn.scatterplot( x, y, data, legend=”brief)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, hue='day',
                    sizes=(30, 200), legend='brief')

Đầu ra:

7. Thêm thuộc tính alpha.

Sử dụng alpha, chúng ta có thể kiểm soát độ mờ theo tỷ lệ của các điểm. Chúng ta có thể giảm và tăng độ mờ.

Cú pháp: seaborn.scatterplot( x, y, data, alpha=”0.2″)

 

 

 

seaborn.scatterplot(x='day', y='tip', data=tip, alpha = 0.1)

Đầu ra: