Вопросы с тегом 'dataframe'

Кадр данных представляет собой структуру табличных данных. Обычно он содержит данные, в которых строки являются наблюдениями, а столбцы являются переменными различных типов. Хотя "фрейм данных" или "dataframe" - это термин, используемый для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), "table" - это термин, используемый в MATLAB и SQL.
35

Переименование столбцов в pandas

У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хотел бы изменить имена столбцов в DataFrame A где исходные имена столбцов: ['$a', '$b', '$c', '$d', '$e'] ...
05 июл. '12 в 14:21
15

Выберите строки из DataFrame на основе значений в столбце в pandas

Как выбрать строки из DataFrame на основе значений в некотором столбце в пандах? В SQL я бы использовал: SELECT * FROM table WHERE colume_name = some_value Я попытался просмотреть документацию панд, но не сразу нашел ответ.
12 июн. '13 в 17:42
20

Как перебирать строки в DataFrame в Pandas?

У меня есть DataFrame от панд: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Выход: c1 c2 0 10 100 1 11 110 2 12 120 Теперь я хочу перебрать строки этого кадра....
10 мая '13 в 7:04
20

Как отсортировать фрейм данных по нескольким столбцам

Я хочу сортировать data.frame по нескольким столбцам. Например, с приведенным ниже номером data.frame, я хотел бы отсортировать по столбцу z (убыв), затем по столбцу b (по возрастанию): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), ...
18 авг. '09 в 21:33
13

Как объединить (объединить) фреймы данных (внутренний, внешний, левый, правый)

Учитывая два кадра данных: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaste...
19 авг. '09 в 13:18
20

Удалить столбец из панды DataFrame

При удалении столбца в DataFrame я использую: del df['column_name'] И это прекрасно работает. Почему я не могу использовать следующее? del df.column_name Поскольку вы можете получить доступ к столбцу/Серии как df.column_name, я ожидаю, что это с...
16 нояб. '12 в 6:26
20

Получить список из pandas заголовков столбцов DataFrame

Я хочу получить список заголовков столбцов в панде DataFrame. DataFrame будет получен из пользовательского ввода, поэтому я не буду знать, сколько будет столбцов или как они будут называться. Например, если мне дан DataFrame, как это: >>> ...
20 окт. '13 в 21:18
23

Добавление нового столбца в существующий DataFrame в Python pandas

У меня есть следующий индексированный DataFrame с именованными столбцами, а строки - не непрерывными числами: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 ...
23 сент. '12 в 19:00
22

Удаление столбцов фрейма данных по имени

У меня есть несколько столбцов, которые я хотел бы удалить из фрейма данных. Я знаю, что мы можем удалить их индивидуально, используя что-то вроде: df$x <- NULL Но я надеялся сделать это с меньшим количеством команд. Кроме того, я знаю, что я ...
05 янв. '11 в 14:34
18

Выбор нескольких столбцов в кадре данных pandas

У меня есть данные в разных столбцах, но я не знаю, как их извлечь, чтобы сохранить их в другой переменной. index a b c 1 2 3 4 2 3 4 5 Как выбрать 'a', 'b' и сохранить его в df1? Я старался df1 = df['a':'b'] df1 = df.ix[:,...
01 июл. '12 в 21:03
17

Удалите строки со всеми или некоторыми НС (отсутствующие значения) в data.frame

Я хотел бы удалить строки в этом фрейме данных, которые: a) содержат NA по всем столбцам. Ниже приведен примерный кадр данных. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 ...
01 февр. '11 в 11:52
18

Добавить одну строку в панды DataFrame

Я понимаю, что pandas предназначен для загрузки полностью заполненного DataFrame, но мне нужно создать пустой DataFrame, а затем добавить строки, один за другим. Каков наилучший способ сделать это? Я успешно создал пустой DataFrame с: res = DataF...
23 мая '12 в 8:12
13

Как я могу получить количество строк в DataFrame панд?

Я пытаюсь получить количество строк в df с помощью Pandas, и вот мой код. Способ 1: total_rows = df.count print total_rows +1 Способ 2: total_rows = df['First_columnn_label'].count print total_rows +1 Оба фрагмента кода дают мне эту ошибку: О...
11 апр. '13 в 8:14
27

Как изменить порядок столбцов DataFrame?

У меня есть следующий DataFrame (df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Я добавляю больше столбцов (-ов) по назначению: df['mean'] = df.mean(1) Как перенести столбец mean в начало, т.е. установит...
30 окт. '12 в 22:22
18

Как заменить значения NA нулями в R-кадре данных?

У меня есть фрейм данных, и некоторые столбцы имеют значения NA. Как заменить эти значения NA на нули?
17 нояб. '11 в 3:45