用户对电影的部分评分数据 ratings. dat
该数据包含4个字段 UserID(用户ID) MovieID(电影ID) Rating(评分)及 Timestamp(时间戳) UserID的范围是1~6040, MovieID的范围是1~3952, Rating采用5分好评制度,即最高分为5分,最低分为1分
已知性别的用户信息部分数据 users.dat
该数据包含5个字段 UserID(用户ID) Gender(性别)Age(年龄)Occupation(职业)以及Zip-code(编码)
部分电影信息数据 movies.dat
MovieID(电影ID) Title(电影名称) Genres(电影类型)3个字段 Title字段不仅记录电影的名称,还记录了电影的上映时间。数据中总共记录了18种电影类型,包括喜剧片、动作片、警匪片、爱情片
hadoop jar ratings_users.jar demo. RatingsAndusers /movie/users.dat/movie/ratings.dat/movie/ratings_ users