|
questions
Some questions when I implement the algorithms
IntroductionSome questions when I implement the algorithms Details 问题如下 |
► Sign in to add a comment
|
Search
|
|
questions
Some questions when I implement the algorithms
IntroductionSome questions when I implement the algorithms Details 问题如下 |
1、关于稀疏矩阵的数据结构,为什么不采用邻接矩阵的方式,又或者是压缩比高的CSR或CSC方式?
2、现在的rateMatrix是根据ITEM的数量预先静态分配内存的,推广性比较差,很难适用于更灵活的数据集。建议接口定义为以ITEM数量或总记录数量为参数,利用邻接矩阵或CSR格式来动态分配内存。对于movielen与netflix的数据,只要在外面包一个函数,设置一下参数,然后调用这个接口函数即可。
1.对于系数矩阵,用十字链表比较方便些,效率也比较高。 2.这个问题我也碰到过,大部分的item之间的相似度为1。另外你用的数据类型是什么?
1、我这个是打分矩阵,就是训练数据集,也用十字链表吗? 2、“有很多item之间的相似度为1”我用的是float存储的