Вопросы с тегом 'dplyr'

Используйте этот тег для вопросов, связанных с функциями из пакета dplyr, таких как group_by, суммировать, фильтровать и выбирать.
3

data.table vs dplyr: может ли что-то сделать хорошо, а другое плохо или плохо?

обзор Я относительно знаком с data.table, не так много с dplyr. Я прочитал некоторые виньетки и примеры dplyr на SO, и пока мои выводы таковы: data.table и dplyr сопоставимы по скорости, за исключением случаев, когда существует много (то есть>...
29 янв. '14 в 15:21
4

Просмотреть/распечатать весь текст (tbl_df)?

tibble (ранее tbl_df) - это версия фрейма данных, созданного пакетом манипуляции с фреймами данных dplyr в R. Он предотвращает выходы длинных таблиц при случайном вызове кадра данных. Как только кадр данных был обернут tibble/tbl_df, есть ли кома...
20 апр. '14 в 23:55
9

Группировать по нескольким столбцам в dplyr, используя ввод векторной строки

Я пытаюсь передать свое понимание plyr в dplyr, но я не могу понять, как группировать по нескольким столбцам. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, rep...
18 янв. '14 в 19:26
9

Фиксирование множественного предупреждения "неизвестный столбец"

У меня есть постоянное многократное предупреждение "неизвестного столбца" для всех типов команд (например, str (x) для установки обновлений пакетов), и не уверен, как отладить это или исправить. Предупреждение "неизвестный столбец" явно связано с пе...
19 авг. '16 в 14:07
7

Относительные частоты/пропорции с dplyr

Предположим, что я хочу рассчитать долю разных значений в каждой группе. Например, используя данные mtcars, как я могу рассчитать относительную частоту числа передач с помощью am (автоматически/вручную) за один раз с помощью dplyr? library(dply...
04 июл. '14 в 14:31
5

Может ли пакет dplyr использоваться для условного мутирования?

Могут ли mutate использоваться, если мутация является условной (в зависимости от значений определенных значений столбца)? Этот пример помогает показать, что я имею в виду. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6)...
27 июн. '14 в 19:48
7

mutate: использовать динамические имена переменных

Я хочу использовать dplyr mutate() для создания нескольких новых столбцов в фрейме данных. Имена столбцов и их содержимое должны быть динамически сгенерированы. Пример данных из диафрагмы: require(dplyr) data(iris) iris <- tbl_df(iris) Я соз...
23 сент. '14 в 19:51
8

Выберите первую и последнюю строку из сгруппированных данных

Вопрос Используя dplyr, как я могу выбрать верхние и нижние наблюдения/строки сгруппированных данных в одном выражении? Данные и пример С учетом кадра данных df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c",...
21 июл. '15 в 1:41
7

Замена для "переименования" в dplyr

Мне нравится функция переименования plyr rename. Я недавно начал использовать dplyr и задавался вопросом, есть ли простой способ переименовать переменные, используя функцию из dplyr, которая так же проста в использовании, как и plyr rename?
01 февр. '14 в 19:25
6

Удаление дублированных строк с помощью dplyr

У меня есть data.frame, как это - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Я х...
09 апр. '14 в 10:22
6

Применение функции к каждой строке таблицы с помощью dplyr?

При работе с plyr мне часто было полезно использовать adply для скалярных функций, которые я должен применять к каждой строке. например. data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) ...
16 февр. '14 в 23:21
5

Суммируя несколько столбцов с dplyr?

Я немного борюсь с dplyr-синтаксисом. У меня есть кадр данных с разными переменными и одна переменная группировки. Теперь я хочу рассчитать среднее значение для каждого столбца в каждой группе, используя dplyr в R. df <- data.frame(a=sample(1:5, ...
08 февр. '14 в 10:27
5

Соберите несколько наборов столбцов

У меня есть данные из онлайн-опроса, где респонденты проходят цикл вопросов 1-3 раза. Программное обеспечение опроса (Qualtrics) записывает эти данные в несколько столбцов, то есть Q3.2 в опросе будет иметь столбцы Q3.2.1., Q3.2.2. и Q3.2.3.: df &l...
19 сент. '14 в 2:41
4

dplyr суммировать: Эквивалент ".drop = FALSE" для сохранения групп с нулевой длиной в выходе

При использовании summarise с функцией plyr ddply пустые категории по умолчанию отбрасываются. Вы можете изменить это поведение, добавив .drop = FALSE. Однако при использовании summarise с dplyr это не работает. Есть ли другой способ сохранить пусты...
20 мар. '14 в 3:52
1

R, распространяющих несколько столбцов с тидиром

Возьмите эту переменную образца df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), B=c(6, 7, 8, 5, 6, 7)) Я могу использовать spread из tidyr, чтоб...
02 июн. '15 в 9:22