Review Pandas chuyển đổi số float thành số thập phân

Kinh Nghiệm Hướng dẫn Pandas quy đổi số float thành số thập phân Chi Tiết

Bùi Trung Huấn đang tìm kiếm từ khóa Pandas quy đổi số float thành số thập phân được Update vào lúc : 2022-12-19 21:32:05 . Với phương châm chia sẻ Thủ Thuật Hướng dẫn trong nội dung bài viết một cách Chi Tiết 2022. Nếu sau khi đọc Post vẫn ko hiểu thì hoàn toàn có thể lại phản hồi ở cuối bài để Mình lý giải và hướng dẫn lại nha.

Định dạng của những cột và hàng riêng lẻ sẽ tác động đến phân tích được thực hiện trên tập tài liệu được đọc bằng Python. Ví dụ: bạn không thể thực hiện những phép tính toán học trên một chuỗi (tài liệu được định dạng văn bản). Điều này còn có vẻ như hiển nhiên, tuy nhiên đôi khi những giá trị số được đọc vào Python dưới dạng chuỗi. Trong tình huống này, khi bạn nỗ lực thực hiện những phép tính trên tài liệu số có định dạng chuỗi, bạn sẽ gặp lỗi

Nội dung chính Show
    Các loại dữ liệuKiểu tài liệu sốKiểu tài liệu văn bảnKiểm tra định dạng tài liệu của chúng tôiLàm việc với số nguyên và số floatLàm việc với tài liệu khảo sát của chúng tôiThay đổi loạiThiếu giá trị tài liệu - NaNNaN ở đâu?Viết tài liệu ra CSVLàm cách nào để quy đổi giá trị float thành số nguyên trong gấu trúc?Làm cách nào để quy đổi số float thành số nguyên trong Python?Chúng ta hoàn toàn có thể tàng trữ số float ở dạng số thập phân trong Python không?Làm cách nào để quy đổi NaN float thành số nguyên?

Trong bài học kinh nghiệm tay nghề này, chúng tôi sẽ xem xét những phương pháp để mày mò và làm rõ hơn về cấu trúc và định dạng tài liệu của chúng tôi

Các loại tài liệu

Cách thông tin được tàng trữ trong DataFrame hoặc đối tượng Python ảnh hưởng đến những gì tất cả chúng ta hoàn toàn có thể làm với nó và cả kết quả tính toán. Có hai loại tài liệu chính mà tất cả chúng ta sẽ mày mò trong bài học kinh nghiệm tay nghề này. kiểu tài liệu số và văn bản

Kiểu tài liệu số

Các kiểu tài liệu số gồm có số nguyên và số float. Số dấu phẩy động (được gọi là số float) có dấu thập phân trong cả những lúc giá trị dấu thập phân đó bằng 0. Ví dụ. 1. 13, 2. 0, 1234. 345. Nếu tất cả chúng ta có một cột chứa cả số nguyên và số dấu phẩy động, Pandas sẽ gán toàn bộ cột cho kiểu tài liệu float để những dấu thập phân vẫn tồn tại

Một số nguyên sẽ không bao giờ có dấu thập phân. Vì vậy, nếu tất cả chúng ta muốn tàng trữ 1. 13 dưới dạng số nguyên, nó sẽ được lưu dưới dạng 1. Tương tự, 1234. 345 sẽ được tàng trữ dưới dạng 1234. Bạn sẽ thường thấy kiểu tài liệu

surveys_df['sex'].dtype 4 trong Python viết tắt của số nguyên 64 bit. 64 đề cập đến bộ nhớ được phân bổ để tàng trữ tài liệu trong mỗi ô, liên quan hiệu suất cao đến số lượng chữ số mà nó hoàn toàn có thể tàng trữ trong mỗi “ô”. Phân bổ không khí trước thời hạn được cho phép máy tính tối ưu hóa hiệu suất cao tàng trữ và xử lý

Kiểu tài liệu văn bản

Kiểu tài liệu văn bản được gọi là Chuỗi trong Python hoặc Đối tượng trong Pandas. Chuỗi hoàn toàn có thể chứa số và/hoặc ký tự. Ví dụ: một chuỗi hoàn toàn có thể là một từ, một câu hoặc nhiều câu. Một đối tượng Pandas cũng hoàn toàn có thể là một tên diễn biến như 'plot1'. Một chuỗi cũng hoàn toàn có thể chứa hoặc gồm có những số. Chẳng hạn, '1234' hoàn toàn có thể được tàng trữ dưới dạng một chuỗi, cũng như '10'. 23’. Tuy nhiên, những chuỗi chứa số không thể được sử dụng cho những phép toán

Pandas và Python cơ sở sử dụng những tên hơi rất khác nhau cho những loại tài liệu. Thêm về điều này là trong bảng dưới đây

Pandas TypeNative Python TypeDescriptionobjectstringDtype chung nhất. Sẽ được gán cho cột của bạn nếu cột có nhiều loại (số và chuỗi). int64intKý tự số. 64 đề cập đến bộ nhớ được phân bổ để giữ ký tự này. float64 float Các ký tự số có số thập phân. Nếu một cột chứa số và NaN (xem phía dưới), gấu trúc sẽ mặc định là float64, trong trường hợp giá trị bị thiếu của bạn có số thập phân. datetime64, timedelta[ns]N/A (nhưng hãy xem mô-đun datetime trong thư viện chuẩn của Python) Các giá trị dùng để chứa tài liệu thời gian. Nhìn vào những điều này cho những thí nghiệm chuỗi thời gian

Kiểm tra định dạng tài liệu của chúng tôi

Giờ đây, tất cả chúng ta đã được trang bị kiến ​​thức cơ bản về nhiều chủng loại tài liệu số và văn bản, hãy cùng mày mò định dạng tài liệu khảo sát của tất cả chúng ta. Chúng ta sẽ thao tác với cùng một bộ tài liệu

surveys_df['sex'].dtype 5 mà tất cả chúng ta đã sử dụng trong những bài học kinh nghiệm tay nghề trước

# Make sure pandas is loaded import pandas as pd # Note that pd.read_csv is used because we imported pandas as pd surveys_df = pd.read_csv("data/surveys.csv")

Hãy nhớ rằng tất cả chúng ta hoàn toàn có thể kiểm tra loại đối tượng như vậy này

type(surveys_df)

pandas.core.frame.DataFrame

Tiếp theo, hãy xem cấu trúc tài liệu khảo sát của chúng tôi. Trong pandas, tất cả chúng ta hoàn toàn có thể kiểm tra loại của một cột trong DataFrame bằng cú pháp

surveys_df['sex'].dtype 6

surveys_df['sex'].dtype

dtype('O')

Loại 'O' chỉ là viết tắt của "đối tượng" mà trong thế giới của Pandas là một chuỗi (văn bản)

________số 8

dtype('int64')

Loại

surveys_df['sex'].dtype 7 cho tất cả chúng ta biết rằng Python đang tàng trữ từng giá trị trong cột này dưới dạng số nguyên 64 bit. Chúng ta hoàn toàn có thể sử dụng lệnh surveys_df['sex'].dtype 8 để xem kiểu tài liệu cho từng cột trong DataFrame (tất cả cùng một lúc)

surveys_df['sex'].dtype 2

trả về

surveys_df['sex'].dtype 3

Lưu ý rằng hầu hết những cột trong tài liệu Khảo sát của chúng tôi thuộc loại

surveys_df['sex'].dtype 7. Điều này nghĩa là chúng là số nguyên 64 bit. Nhưng cột trọng lượng là một giá trị dấu phẩy động nghĩa là nó chứa số thập phân. Các cột dtype('O') 0 và dtype('O') 1 là những đối tượng nghĩa là chúng chứa những chuỗi

Làm việc với số nguyên và số float

Vì vậy, chúng tôi đã học được rằng máy tính tàng trữ số theo một trong hai cách. dưới dạng số nguyên hoặc dưới dạng số dấu phẩy động (hoặc số float). Số nguyên là số tất cả chúng ta thường đếm với. Số float có phần thập phân (số thập phân). Tiếp theo, hãy xem xét cách loại tài liệu hoàn toàn có thể tác động đến những hoạt động và sinh hoạt giải trí sinh hoạt toán học trên tài liệu của tất cả chúng ta. Phép cộng, phép trừ, phép chia và phép nhân hoạt động và sinh hoạt giải trí trên số float và số nguyên như tất cả chúng ta mong đợi

surveys_df['sex'].dtype 7

type(surveys_df) 0

type(surveys_df) 1

type(surveys_df) 2

Nếu tất cả chúng ta chia một số trong những nguyên cho một số trong những nguyên khác, tất cả chúng ta sẽ nhận được một số trong những float. Kết quả trên Python 3 khác với Python 2, trong đó kết quả là một số trong những nguyên (chia số nguyên)

type(surveys_df) 3

type(surveys_df) 4

type(surveys_df) 5

type(surveys_df) 6

Chúng ta cũng hoàn toàn có thể quy đổi số dấu phẩy động thành số nguyên hoặc số nguyên thành số dấu phẩy động. Lưu ý rằng Python theo mặc định sẽ làm tròn xuống khi nó quy đổi từ dấu phẩy động sang số nguyên

type(surveys_df) 7

type(surveys_df) 8

type(surveys_df) 9

pandas.core.frame.DataFrame 0

Làm việc với tài liệu khảo sát của chúng tôi

Quay trở lại tài liệu của chúng tôi, chúng tôi hoàn toàn có thể sửa đổi định dạng của những giá trị trong tài liệu của tớ, nếu chúng tôi muốn. Chẳng hạn, tất cả chúng ta hoàn toàn có thể quy đổi trường

dtype('O') 2 thành giá trị dấu phẩy động

pandas.core.frame.DataFrame 1

pandas.core.frame.DataFrame 2

Thay đổi loại

Hãy thử quy đổi cột

dtype('O') 3 thành float bằng phương pháp sử dụng

pandas.core.frame.DataFrame 3

Tiếp theo hãy thử quy đổi

dtype('O') 4 thành một số trong những nguyên. Có gì sai ở đây?

Thiếu giá trị tài liệu - NaN

Điều gì đã xảy ra trong hoạt động và sinh hoạt giải trí thử thách ở đầu cuối? .

dtype('O') 5. Nếu tất cả chúng ta nhìn vào cột dtype('O') 4 trong tài liệu khảo sát, tất cả chúng ta sẽ nhận thấy rằng có những giá trị NaN (Không phải là Số). Giá trị NaN là giá trị không xác định không thể được màn biểu diễn bằng toán học. Ví dụ, gấu trúc sẽ đọc một ô trống trong trang tính CSV hoặc Excel dưới dạng NaN. NaN có một số trong những thuộc tính mong ước. nếu tất cả chúng ta tính trung bình cột dtype('O') 4 mà không thay thế những NaN của tớ, Python sẽ biết bỏ qua những ô đó

pandas.core.frame.DataFrame 4

pandas.core.frame.DataFrame 5

Xử lý những giá trị tài liệu bị thiếu vẫn là một thách thức. Đôi khi rất khó để biết tại sao những giá trị bị thiếu - có phải do lỗi nhập tài liệu không? . Nếu như mong ước, chúng tôi có một số trong những siêu tài liệu sẽ cho chúng tôi biết thêm về cách xử lý những giá trị null

Chẳng hạn, trong một số trong những nghành, như Viễn thám, những giá trị tài liệu bị thiếu thường được định nghĩa là -9999. Có một loạt những giá trị -9999 trong tài liệu của bạn thực sự hoàn toàn có thể thay đổi những phép tính số. Thông thường trong bảng tính, những ô bị bỏ trống lúc không còn tài liệu. Theo mặc định, gấu trúc sẽ thay thế những giá trị bị thiếu đó bằng NaN. Tuy nhiên, bạn nên tập thói quen đánh dấu có chủ ý những ô không còn tài liệu, không còn mức giá trị tài liệu. Bằng cách đó, sẽ không còn thắc mắc nào trong tương lai khi bạn (hoặc người khác) mày mò tài liệu của bạn

NaN ở đâu?

Hãy mày mò thêm một chút ít về những giá trị NaN trong tài liệu của chúng tôi. Sử dụng những công cụ đã học ở bài 02, tất cả chúng ta hoàn toàn có thể tính xem có bao nhiêu hàng chứa giá trị NaN cho trọng số. Chúng tôi cũng hoàn toàn có thể tạo một tập hợp con mới từ tài liệu của tớ chỉ chứa những hàng có mức giá trị trọng số > 0 (i. e. , chọn giá trị trọng số có ý nghĩa)

pandas.core.frame.DataFrame 6

Chúng ta hoàn toàn có thể thay thế tất cả những giá trị NaN bằng 0 bằng phương pháp sử dụng phương pháp

dtype('O') 8 (sau khi tạo một bản sao tài liệu để không mất công)

pandas.core.frame.DataFrame 7

Tuy nhiên NaN và 0 mang lại kết quả phân tích rất khác nhau. Giá trị trung bình khi những giá trị NaN được thay thế bằng 0 khác với khi những giá trị NaN bị vô hiệu hoặc bỏ qua một cách đơn giản

pandas.core.frame.DataFrame 8

pandas.core.frame.DataFrame 9

Chúng tôi hoàn toàn có thể điền những giá trị NaN với bất kỳ giá trị nào mà chúng tôi đã chọn. Mã phía dưới điền vào tất cả những giá trị NaN với giá trị trung bình cho tất cả những giá trị trọng số

surveys_df['sex'].dtype 0

Chúng tôi cũng hoàn toàn có thể chọn tạo một tập hợp con tài liệu của tớ, chỉ giữ những hàng không chứa giá trị NaN

Vấn đề là đưa ra quyết định có ý thức về cách quản lý tài liệu bị thiếu. Đây là nơi chúng tôi nghĩ về cách tài liệu của chúng tôi sẽ được sử dụng và những giá trị này sẽ tác động ra làm sao đến những kết luận khoa học được đưa ra từ tài liệu

Python đáp ứng cho chúng tôi tất cả những công cụ mà chúng tôi cần để xử lý và xử lý những vấn đề này. Chúng ta chỉ việc thận trọng về cách những quyết định mà tất cả chúng ta đưa ra ảnh hưởng đến kết quả khoa học

Đếm

Đếm số lượng giá trị bị thiếu trên mỗi cột

Gợi ý

Phương pháp

dtype('O') 9 đáp ứng cho bạn số lượng quan sát không NA trên mỗi cột. Hãy thử tìm đến phương pháp surveys_df['record_id'].dtype 0

Viết tài liệu ra CSV

Chúng tôi đã học về cách sử dụng thao tác tài liệu để đã có được đầu ra mong ước. Nhưng chúng tôi đã và đang thảo luận về việc giữ tài liệu đã được thao tác tách biệt với tài liệu thô của chúng tôi. Một cái gì đó chúng tôi hoàn toàn có thể quan tâm đến là chỉ thao tác với những cột có đầy đủ tài liệu. Trước tiên, hãy tải lại tài liệu để chúng tôi không trộn lẫn tất cả những thao tác trước đó của tớ

surveys_df['sex'].dtype 1

Tiếp theo, hãy bỏ tất cả những hàng chứa giá trị bị thiếu. Chúng tôi sẽ sử dụng lệnh

surveys_df['record_id'].dtype 1. Theo mặc định, dropna sẽ xóa những hàng chứa tài liệu bị thiếu mặc dầu chỉ một cột

surveys_df['sex'].dtype 2

Nếu giờ đây bạn nhập

surveys_df['record_id'].dtype 2, bạn sẽ thấy rằng DataFrame kết quả có 30676 hàng và 9 cột, nhỏ hơn nhiều so với 35549 hàng ban đầu

Bây giờ tất cả chúng ta hoàn toàn có thể sử dụng lệnh

surveys_df['record_id'].dtype 3 để xuất DataFrame ở định dạng CSV. Lưu ý rằng mã phía dưới sẽ theo mặc định lưu tài liệu vào thư mục thao tác hiện tại. Chúng tôi hoàn toàn có thể lưu nó vào một thư mục khác bằng phương pháp thêm tên thư mục và dấu gạch chéo trước tên tệp. surveys_df['record_id'].dtype 4. Chúng tôi sử dụng 'index=False' để gấu trúc không gồm có số chỉ mục cho từng dòng

surveys_df['sex'].dtype 3

Chúng tôi sẽ sử dụng tệp tài liệu này sau trong hội thảo chiến lược. Kiểm tra thư mục thao tác của bạn để đảm bảo CSV được viết đúng cách và bạn hoàn toàn có thể mở nó. Nếu bạn muốn, hãy thử đưa nó trở lại Python để đảm bảo nó nhập đúng cách

Làm cách nào để quy đổi giá trị float thành số nguyên trong gấu trúc?

Để quy đổi một cột gồm có hỗn hợp những giá trị float và NaN thành int, trước tiên hãy thay thế những giá trị NaN bằng 0 trên DataFrame của gấu trúc, sau đó sử dụng astype() để quy đổi. Use DataFrame. fillna() to replace the NaN values with integer value zero.

Làm cách nào để quy đổi số float thành số nguyên trong Python?

Giá trị float hoàn toàn có thể được quy đổi thành giá trị int không to hơn giá trị đầu vào bằng phương pháp sử dụng phép toán. hàm floor() , trong khi hàm này cũng hoàn toàn có thể được quy đổi thành giá trị int là số nguyên nhỏ nhất to hơn giá trị đầu vào bằng toán học. hiệu suất cao trần(). Mô-đun toán học sẽ được nhập để sử dụng những phương thức này.

Chúng ta hoàn toàn có thể tàng trữ số float ở dạng số thập phân trong Python không?

Nếu giá trị là số float , giá trị dấu phẩy động nhị phân được quy đổi thuận tiện và đơn giản thành số thập phân đúng chuẩn tương đương . Chuyển đổi này thường hoàn toàn có thể yêu cầu độ đúng chuẩn từ 53 chữ số trở lên. Ví dụ: Số thập phân(float('1. 1')) chuyển thành Thập phân('1. 100000000000000088817841970012523233890533447265625').

Làm cách nào để quy đổi NaN float thành số nguyên?

Chúng ta hoàn toàn có thể thay thế những giá trị NaN bằng 0 để vô hiệu những giá trị NaN . Điều này được thực hiện bằng phương pháp sử dụng hàm fillna(). Hàm này sẽ kiểm tra những giá trị NaN trong những cột của khung tài liệu và điền vào giá trị đã cho. Tải thêm tài liệu liên quan đến nội dung bài viết Pandas quy đổi số float thành số thập phân programming

Review Pandas quy đổi số float thành số thập phân ?

Bạn vừa đọc Post Với Một số hướng dẫn một cách rõ ràng hơn về Review Pandas quy đổi số float thành số thập phân tiên tiến nhất

Share Link Down Pandas quy đổi số float thành số thập phân miễn phí

Bạn đang tìm một số trong những Share Link Cập nhật Pandas quy đổi số float thành số thập phân Free.

Hỏi đáp thắc mắc về Pandas quy đổi số float thành số thập phân

Nếu sau khi đọc nội dung bài viết Pandas quy đổi số float thành số thập phân vẫn chưa hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Mình lý giải và hướng dẫn lại nha #Pandas #chuyển #đổi #số #float #thành #số #thập #phân