[R]

May 25, 2009 16:11

Tried working in R for the first time. It took me 20 minutes to export an SPSS dataset (in csv format) into R and compute mean and SD on one variable. It turned out that in R it's hard to deal with missing values ( Read more... )

programming, r

Leave a comment

Comments 18

cunctator_ May 25 2009, 21:41:36 UTC
What`s wrong with na.omit and the like? How else can you organize that?

Reply

statzman May 25 2009, 21:46:14 UTC
I actually ended up using na.omit - I just was not expecting to encounter any problems with missing values in the first place. In SPSS all missing values are just ignored by default.

Reply

cunctator_ May 25 2009, 21:48:54 UTC
hehe same here, I actually spend like a whole evening setting up a usable script before I found out about na.omit. In the end it turns out that R has practically anything one might think of.

Reply

allogenes May 26 2009, 23:58:11 UTC
Yes, but that is not always a good default. In more advanced analyses you need the flexibility of R's various na handlers. If you want to ease the transition to R, there are some layers you can add on to make it look more like a GUI based package, but I don't recommend them. Like they say: "R: it makes the easy things hard, but it makes the impossible things possible."

Welcome to the club. :-)

Reply


tt_net May 26 2009, 02:37:54 UTC
а зачем такие сложности, не проще ли в .NET?

Reply

statzman May 26 2009, 02:42:25 UTC
А причём тут .NET? Это же, вроде, универсальный язык (типа Java), а не статистический?

Reply

tt_net May 26 2009, 03:32:40 UTC
Задача то тривиальная, или я не так понял
А язык - какая разница, output всё равно скомпилированый машинный

Reply

statzman May 26 2009, 03:43:03 UTC
Да нет, тут суть не в том, чтобы Mean & SD посчитать (это теперь можно сделать даже в Интернете на http://www.wolframalpha.com/). Смысл всех моих сегодняшних мучений - научиться пользоваться новым статистическим софтом. В идеале мне хотелось бы к выпуску владеть в какой-то мере SPSS, SAS, & R.

Reply


bratcho June 17 2009, 03:39:18 UTC
Для соц. наук, думаю, будет оптимальным SPSS, т.к. у него более удобный интерфейс по сравнению с SASом. Хоть наш препод по статистике и заставлял использовать SAS, презентационные возможности его весьма ограничены. Чего только стоит scatter plot из иксов и палочек, не говоря уже о геморре с вводом команд.

Тем более, если специальность психология и вопрос в основном идет об эксперименте и сравнении двух групп, то обычного набора SPSS - t test или той же ANOVA или ANCOVA для нескольких переменных, включая скрытых будет вполне достаточно.

Какое направление в психологии? Я сам занимаюсь perception and social amplification of risk, и на психологии пару классов пришлось взять.

Reply

statzman June 17 2009, 03:48:14 UTC
Приветствую психолога! Меня, в общем-то, SPSS всем устраивает пока, только я сейчас начинаю работу искать, а SPSS кроме как в университетах мало кто использует. Так что нужно иметь представление об основных программах, которые используются вне универов - в первую очередь R и SAS.

Reply


bratcho June 17 2009, 03:55:11 UTC
Чтож, взаимно приветсвую! Только я не психолог, а пиарщик, хотя суть практически одна: понять почему люди (массы) поступают так или иначе, и зная это, осуществить на них целенаправленное инфомрационное воздействие (за хорошее вознаграждение). )) Блин, как же по русски все это коряво звучит, а?

PS Фамилия у тебя по ходу восточная. Предки откуда будут?

Reply

statzman June 17 2009, 03:57:34 UTC
У меня специальность - психометрика, так что на массы я влиять пока не собираюсь (-: А фамилия у меня казахская - от папы.

Reply

bratcho June 17 2009, 03:59:39 UTC
Ну мы с тобой братья-славяне тогда! Я сам из Ташкента ) и фамилия у меня тоже узбекская, и тоже - от папы

Reply

statzman June 17 2009, 04:01:21 UTC
А имя мне специально подбирали нейтральное - чтобы его все запомнить и выговорить могли (-:

Reply


Leave a comment

Up