読者です 読者をやめる 読者になる 読者になる

やってることをてけとーに載せていくよ

問題発見と解決 R

なんとなく醸していきます。

期間を限定して時系列プロットをやってみる

前回やったときは1月からの全期間でやってたのですが、モデルを作るとあれれ。。。な感じになってしまったので、期間をしぼってやってみることにしました。

線形に上がっているトレンドがあるような無いような。

曜日ごとのアクセス数の基本統計量と密度トレイス

書いた後にこの辺で同じことやってたじゃん、と気がついたがまあ気にしない。






my.plot <- function(x,week){
  png(paste(week,".png",sep=""))
  plot(density(x),main="")
  title(paste(week,"(mean=",round(mean(x),digits=1),",median=",round(median(x),digits=1),",sd=",round(sd(x),digits=1),")"))
  dev.off()
}
my.plot(log$count[log$week==0],"Sunday")
my.plot(log$count[log$week==1],"Monday")
my.plot(log$count[log$week==2],"Tuesday")
my.plot(log$count[log$week==3],"Wednesday")
my.plot(log$count[log$week==4],"Thursday")
my.plot(log$count[log$week==5],"Friday")
my.plot(log$count[log$week==6],"Saturday")

曜日ごとの平均アクセス数の推移

要するに曜日と時間のクロス表を作ってるだけなのだけど。これ見てみると曜日ごとでアクセスの動向結構違うな。

曜日 特徴
土日 日中はほとんど上がらない。20時以降に多いようだ。
月曜 9頃から一定数のアクセスが続いていることが読み取れる。9時の急激な上がりかたは休日後の出勤とか学校だからか?みんな仕事しろ。
その他平日 大体お昼を境に一定数のアクセスが続いている感じかな。月曜だと9時に急激な上がりかたを見せたが、他の曜日だと12時くらいか。
my.table <- tapply(log$count,list(log$week,log$hour),mean)

plot(my.table[1,],type="l",col=1,ylim=c(0,10),xlab="時間",ylab="平均アクセス数")
for(i in 2:7){
  lines(my.table[i,],col=i)
}
legend(1,10,c("日","月","火","水","木","金","土"),col=1:7,lwd=1)
title(main="曜日ごとの平均アクセス数の推移")
grid()