CN100508592C - 创建用户简档和为用户提供节目建议的方法、装置 - Google Patents
创建用户简档和为用户提供节目建议的方法、装置 Download PDFInfo
- Publication number
- CN100508592C CN100508592C CNB038201607A CN03820160A CN100508592C CN 100508592 C CN100508592 C CN 100508592C CN B038201607 A CNB038201607 A CN B038201607A CN 03820160 A CN03820160 A CN 03820160A CN 100508592 C CN100508592 C CN 100508592C
- Authority
- CN
- China
- Prior art keywords
- user
- weighting
- speech
- predicate
- program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
- G06F16/437—Administration of user profiles, e.g. generation, initialisation, adaptation, distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/35—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
- H04H60/46—Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising users' preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44222—Analytics of user selections, e.g. selection of programs or purchase activity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/60—Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client
- H04N21/65—Transmission of management data between client and server
- H04N21/658—Transmission by the client directed to the server
- H04N21/6582—Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/16—Analogue secrecy systems; Analogue subscription systems
- H04N7/162—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
- H04N7/163—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
Abstract
通过将用户特点的特殊集合纳入考虑,来获得基于此计算的用户简档和/或建议。用户特点定义为表示就使用用户简档的应用方面而言的个人用户的典型惯常行为。换言之,对于使用用户简档的每个应用,定义用户特点的特殊集合,其能表示个人用户的典型惯常行为。基于这些用户特点,在创建用户简档期间,计算或影响在词加权对列表或表示用户简档的加权的关键词中的加权;和/或在根据多用户简档创建个人用户简档期间,拆分多用户简档;和/或在指定建议期间,过滤用于创建用户简档的用户历史、和/或用户简档、和/或建议结果。
Description
技术领域
本发明涉及创建用户简档和为用户的下次选择指定建议(suggestion)的方法,更具体地说,涉及一种用于创建包含词加权对的列表的用户简档的方法、一种用于根据包含词加权对的列表的多用户简档创建个人用户简档的方法、以及一种为用户下次选择指定建议的方法,其中建议是基于建议结果来指定的,该建议结果是为将来的节目描述和用户简档计算的。
背景技术
已知的几种技术试图对于这些应用的用户的各种内容选择应用都能给出“合理建议”。对于此类建议引擎,通常要对用户及其偏好建模,以便提供最可能的下次内容选择推荐(recommendation)。对用户及其偏好建模的一种通用方法是,利用用户群的预定义定型,该定型表征用户就某些应用和/或主题的兴趣。再者,还广泛采用用户操作的日志记录来推测相应的某些特征。此类推荐系统通常是基于服务器的,并从大量用户收集大量显式评级以构建简档。然后将各用户定位在这些获知的简档的其中之一,并基于该用户可能也喜欢其它用户用于构建喜欢的简档的内容的假设,生成新的可能选择内容的建议。
用户和对应偏好的模型通常是词加权对的列表,即加权的关键词列表,据此搜索新的可能选择以查找最匹配的一个。Ingo Schwab和Alfred Kopsa所著的文献“通过非干扰学习的适应性”(Adaptivitythrough Unobstrusive Learning)(《Künstliche Intelligenz》卷3-02,第5-9页,ISSN 0933-1875)。Arendt Tapp Verlag,Bremen描述了一种方法,用于只从肯定的用户观察结果以隐含方式获知包含此类加权关键词的用户简档。在此文献中,还和用户简档一起描述了几种方法。再有,在Ross Wilkinson、Justin Zobel、Ron Sacks-Davis所著文献“短查询的相似性测定”(similarity measures for short queries)(《Department of Computer Science》,RMIT,GPO Box 2476V,Melbourne 3001,澳大利亚,1995年10月,Fourth Text RetrievalConference(1995),277-285)中,描述了信息检索技术,用于基于或许两到十项的某些关键词查找文章和数据库,特别对于通常较短的随意查询。
如上所述,已知的系统基于现有用户简档和/或用户历史来计算建议,并允许用户可直接编辑用户简档或自动计算该用户简档。同样如上所述,另一个常用的机制是,根据用户群的行为和/或选择将用户分组,其中需要有这些用户就内容的显式评级。然后假定该组中用户所喜欢的对于当前用户也最可能是个好的建议。但是,所有这些方法有一个共同的特点,它们都基于该用户或他所属用户群的整个历史生成非常泛泛的建议。在Conor Hayes、Padraig Cunningham、Patrick Clerkin、Marco Grimaldi所著的文献“节目驱动的音乐收音机”(Program driven music radio)(《Department of Computer Science》,Trinity College Dublin,Proceedings of the ECAI 2002(5th conference onartificial intelligence on 21.to 26.July2002)),其中描述了按照根据当前情况过滤所得到的建议,在流式音频技术和推荐技术中查找与收听者当前的收听偏好相关的更好推荐。这里的当前情况是某个(最近)时窗内用户的行为,以确保建议与用户最终改变的品位相吻合。但是,在此系统中,建议仍可能很泛泛地与当前情况吻合。
根据某个时间段上的观察,对于用户/用户群有效的此类非常泛泛的建议在某些情况下可能并非适合。
发明内容
因此,本发明的目的在于提出改进技术,用于生成用户简档并为用户下次选择指定建议。
本发明的目的通过如下方法解决:根据本发明的一种用于创建包含词加权对列表的用户简档的方法;根据本发明的一种用于根据包含词加权对列表的多用户简档创建个人用户简档的方法;以及根据本发明的一种用于为用户下次选择指定建议的方法,其中建议基于建议结果来指定,该建议结果是为将来的节目描述和用户简档计算的。在随后的从属权利要求中定义了其优选实施例。再者,本发明提出一种计算机程序产品;一种计算机可读存储媒体;一种用于创建包含词加权对列表的用户简档的简档装置;以及建议引擎,用于为用户下次选择指定建议,其中建议基于建议结果来指定,该建议结果是为将来的节目描述和用户简档计算的。本发明定义了建议引擎的优选实施例。
应该注意的是,除如上所述的词加权对(即加权的关键词列表)之外,还可以采用一些更通用的结构,如n字母组(依赖前n个词(停止词除外)的上下文关系的词)。还可以采用包含一个以上词的短语。这些结构称为“关键结构(key structures)”。
还可以采用遗忘因子,即对“旧”关键词(由用户过去的选择所产生的关键词)加权,该关键词被动态地降低加权(取决于它们多久才显示被选择的出现的词)。由此,最近的选择得到较高的加权,因此才有可能与用户兴趣的改变相适应。再者,术语“将来的节目”应该理解为“将来的节目或存储的个人内容”。还有,术语“节目描述”表示还包含“所选内容的描述,例如电视节目简介”。
根据本发明创建包含词加权对列表的用户简档的方法包括如下步骤:基于用户特点(user features)计算加权,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
根据本发明基于包含词加权对列表的多用户简档创建个人用户简档的方法包括如下步骤:基于用户特点将多用户简档至少拆分一次,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
根据本发明用于为用户下次选择指定建议的方法,其中该建议是基于关于将来节目描述和用户简档计算的建议结果确定的,该方法包括如下步骤:基于根据用户特点表示的用户实际情况,过滤用于创建用户简档的用户历史和/或建议结果,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
由此,根据本发明,通过将用户特点的特殊集合纳入考虑,来获得用户简档以及基于此计算的建议。用户特点定义为,表示就使用用户简档的应用而言个人用户的典型惯常行为。换言之,对于使用用户简档的每种应用,都定义用户特点的特殊集合,它可以表示个人用户的典型惯常行为。基于这些用户特点,在创建用户简档过程中,计算或影响在词加权对列表或加权关键词中的加权;在根据多用户简档创建个人用户简档过程中,拆分多用户简档;或在指定建议过程中,过滤用于创建用户简档的用户历史、和/或用户简档、和/或建议结果。
用户特点的选择,须能够表示就特定应用而言个人用户的典型惯常行为,即能够表征用户通常作出选择所依据的预定方案或规则。通过起初对于如现有技术系统中的选择历史进行考虑,根据本发明的方法可以通过改进对用户兴趣的模拟,而非在用户的选择中查找特征,而越来越与个人用户的行为相吻合。
视具体的应用而定,对于依据用户操作推测他的实际喜好,不同的特点是有帮助的/必须的。这些特点不同于最新的“现有技术水平”。通过选择这些特定的特点,可以实施更复杂的推理,以帮助在更深层面上计算用户偏好。
再者,利用用户历史中的特点,基于用户的实际请求,动态地计算特定的简档。例如,可设想与周末相比,用户在工作日观看不同的电影(可能比较短且不是太另人兴奋)。再者,在周末,下午的观看行为也不同于晚上。所以如果在某周六晚上用户点播某个电影,则从历史中选择所有相关项,并从这些项中计算一个非常特别的简档作为当前建议的依据。
或者,可以利用根据惯常历史计算的简档提出多个节目(例如电视表演)的初始建议。然后根据历史中的特点作进一步的过滤。
根据本发明用于创建用户简档的方法最好包括如下步骤:评估来自用户历史对用户特点的影响。
备选或附加地,根据本发明用于创建用户简档的方法最好还包括如下步骤:根据定型用户简档的特征将用户简档分成子用户简档,以得到更加专用的简档。
另一个备选或附加的是,根据本发明用于创建用户简档的方法最好包括如下步骤:基于用户先前选择的节目描述中所含的词,确定要包含在词加权对列表中的词。
在此情况中,根据本发明用于创建用户简档的方法最好包括如下步骤:基于已经包含在列表中的词的同现的数据库评估,确定要包含在词加权对列表中的另一些词。
备选或附加地,在这种情况下,根据本发明用于创建用户简档的方法最好包括如下步骤:基于某个词就所有可用的节目描述而言的反向文档频率(reverse document frequency)与所述词就用户先前选择的节目描述而言的反向文档频率的比较,计算要包含在词加权对列表中的所述词的加权。
在此情况中,另一个备选或附加地,根据本发明用于创建用户简档的方法最好包括如下步骤:以该项:
·所述词就用户先前选择的所有节目描述而言的重要度;
与以下至少一项的乘积来计算要包含在词加权对列表中的词的加权:
·常数项,具体来说为1;
·所述词就其中包含所述词的节目描述而言的重要度;
·所述词就所有可用的节目描述而言的重要度;以及
·校正系数,它与其中含有所述词的节目描述的长度和所述词在该节目描述中的频率相关。
在根据本发明用于创建用户简档的方法中,一个词就用户先前选择的所有节目描述而言的重要度,最好基于所述词在用户先前选择的节目描述的所有词集合中所占比例来确定。
在根据本发明用于创建用户简档的方法中,一个词就所述用户先前选择的所有节目描述而言的重要度,还最好在将包含所述词的节目描述纳入考虑的情况下来确定。
在根据本发明用于创建用户简档的方法中,所述词就与含有所述词的节目描述而言的重要度,最好基于相对于所述词在更大的数据库中的出现次数的所述词在所述节目描述中的出现次数来确定。
在根据本发明用于创建用户简档的方法中,所述词就所有节目描述而言的重要度,最好基于所述词就所有节目描述而言的反向文档频率来确定。
在根据本发明用于创建用户简档的方法中,一个词就所有节目描述而言的重要度,还最好在将包含所述词的节目描述纳入考虑的情况下来确定。
在根据本发明用于创建用户简档的方法中,可以根据下式执行计算要包含在词加权对列表中的词的加权的步骤:
其中wi(t)是词t在节目描述i中的加权;a是所述词t在所述用户的先前选择的所有节目描述中的重要度;t是所述词;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含词t的节目描述的数量;以及N是数据库中节目描述的数量。
在根据本发明用于创建用户简档的方法中,计算加权的步骤最好包括如下步骤:根据用户保持选择以及关断选择(即转换频道的行为)的行为,对包含在所述词加权对列表中的词的计算的加权进行标准化。恰好打开这个选择并正好在结束时关断也起重要的作用。
在根据本发明用于创建用户简档的方法中,备选或附加地,计算加权的步骤最好还包括如下步骤:根据用户何时实际消费记录的选择的行为,对包含在所述词加权对列表中的词的加权进行标准化。
在根据本发明用于创建用户简档的方法中,另一备选或附加地,计算加权的步骤最好还包括如下步骤:将一个词关于其中所述词出现的所述用户先前选择的所有节目描述的取平均。这些是按照对wi(t)取平均来计算的加权w(t)。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:将显示加权低于预定阈值或在加权的预定较低范围内的词从词加权对列表中排除出去。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:通过将用户的负面选择纳入考虑,来计算要包含在所述词加权对列表中的词的加权。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:将就某些用户特点而言的可能用户选择的最大频率纳入考虑,以计算包含在所述词加权对列表中的词的加权。
在根据本发明用于创建用户简档的方法中,所创建的用户简档最好用作在可能的将来节目描述中的查询,以向用户建议至少一个可能的将来选择。
在此情况中,根据本发明用于创建用户简档的方法,最好对于每个可能的将来节目描述计算修改的OKAPI加权,其中每个匹配词都有作为因子的加权以便根据用户简档影响搜索结果。
在此情况中,根据本发明用于创建用户简档的方法,还最好根据如下公式计算所述修改的OKAPI加权:
其中w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权,即wi(t)的平均;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含词t的节目描述的数量;以及N是数据库中节目描述的数量。
在此情况中,根据本发明用于创建用户简档的方法,或者最好还根据如下公式计算所述修改的OKAPI加权:
其中w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度。
在此情况中,备选或附加地,根据本发明用于创建用户简档的方法,最好还通过将定型用户简档与创建的用户简档组合来构建查询,其中最初在首次提供建议时,只使用定型用户简档;在收集数据以计算创建的用户简档期间的第一预定时间内,同时使用两种用户简档的线性组合;以及在所述收集数据以计算创建的用户简档期间的第一预定时间之后,使用所述创建的用户简档。
在根据本发明用于创建用户简档的方法中,定型用户简档可以包括描述每个节目的平均兴趣的通用定型简档以及各定义关注特定主题的用户的兴趣的特定定型简档。
在根据本发明用于创建用户简档的方法中,最好加权通过将所述用户选择与所述各特定定型中的数据相匹配并且如果发现匹配则增大所述定型的加权,来计算在线性组合提供所述建议期间与特定定型用户简档一起纳入考虑的加权。
最初还可对于不同的用户群使用几个定型简档。通过对特定用户或行为的少量观察之后,以初始定型的线性组合的形式计算更特定的定型。
在根据本发明用于创建用户简档的方法中,在第二预定周期之后,通过如下面定义和描述所创建的个人用户简档构建所述查询。
在根据本发明用于创建用户简档的方法中,最好将如下面定义和描述的过滤的用户简档纳入考虑来构建所述查询。
在根据本发明用于由多用户简档创建个人用户简档的方法中,最好通过执行如下步骤来拆分所述多用户简档:
a)根据用户特点执行初步拆分,以生成第一和第二子用户简档;
b)计算两个子用户简档之间的相对差异;
c)执行步骤a)和b),直到执行了所有的或预定数目的初步拆分为止;以及
d)如果所述相对差异在预定阈值之上,根据得到最高相对差异的初步拆分,对多用户简档进行拆分。
在根据本发明用于由多用户简档创建个人用户简档的方法中,在所述拆分过程中,最好通过如下方法计算所述相对差异:计算第一子用户简档基于其中所含的用户特点的第一离散概率分布与第二子用户简档基于其中所含的用户特点的第二离散概率分布之差。
在根据本发明用于由多用户简档创建个人用户简档的方法中,在所述拆分过程中,最好还利用对称Kullback-Leibler距离和来计算所述两个离散概率分布的所述差,其中将发生零次的事件以一个虚拟发生的事件替代或只有在两个分布中至少出现一次的事件被考虑。
根据本发明的上述各方法,最好用于音频/视频节目建议引擎中。
在根据本发明的上述各方法中,所述音频/视频节目建议引擎最好是基于因特网的。
在根据本发明的上述各方法最好是基于客户的,即它在消费类设备上实现,例如TV、机顶盒、VCR、家用服务器,而不是在因特网服务器或类似的公用服务器上实现。
在根据本发明的上述各方法中,所述用户特点最好包括如下特点的一项或多项:
·用户消费的音频/视频节目的首选频道;
·用户消费的音频/视频节目的典型时间;
·用户消费音频/视频节目相对于所述音频/视频节目的总长度的长度;
·用户开始消费音频/视频节目相对于所述音频/视频节目的开始时间的时间;
·用户消费音频/视频节目相对于消费时间的典型长度;
·某个特定音频/视频节目可消费的频度与用户消费的频度之间的关系;
·用户的惯常音频/视频节目消费行为,具体涉及开启时间和使用音频/视频设备的时间长度;
·用户记录的音频/视频节目;
·用户记录某个特定音频/视频节目与用户消费所述音频/视频节目之间的持续时间;
·用户的实际心情;
·用户输入实际希望的音频/视频节目;
·用户消费的音频/视频节目的制作年份;
·用户消费的音频/视频节目的导演和/或演员和/或演员群;
·用户消费的音频/视频节目的类型;以及
·用户消费的音频/视频节目的标题。
根据本发明的计算机程序产品,包括适合于当在计算机、数字信号处理器等设备上执行时进行如上所述的方法步骤的计算机程序装置。
根据本发明的计算机可读存储媒体在其上存储有上述的计算机程序产品。
根据本发明用于创建含有词加权对列表的用户简档的简档器,适合于执行如上所述的方法步骤。
为用户的下次选择指定建议的建议引擎适合于执行上面描述和定义的为用户的下次选择指定建议的方法步骤,根据本发明,所述建议是基于关于将来节目描述和用户简档计算的建议结果确定的。
根据本发明的建议引擎最好包括根据本发明的简档器。
附图说明
下文将参考附图以示范实施例的方式说明本发明。
图1示出了用于家用服务器用户界面的建议引擎的配置;
图2示出了图1所示的简档的配置;
图3a至3c示出了根据本发明第一方面的用户简档生成及其用于提出建议的应用;
图4a和图4b示出了根据本发明第二方面的用户简档的适应和拆分;
图5a至图5c示出了根据本发明第三方面的交互地影响建议引擎的三种可能性。
具体实施方式
在下文中,在向家庭环境中的用户集合提供电视节目的推荐的系统环境中,以实例方式描述本发明。本发明特别适用于这样的系统,因为今天的电视节目的用户面对各种各样的频道和表演,他们要在这些频道和表演之间选择他们想观看或记录的。在因特网上、在电视广播随带的信息流(例如图文电视)或通常在DVB中和机顶盒上提供的电子节目指南(EPG),帮助并协助用户决定观看哪个表演,然而,频道和表演的数量仍然太大。因此,根据本发明为用户提供与他的品位和习惯相吻合的明确建议的引擎,特别适合于确定在特定场合下适合特定用户的建议。当然,事实上特别适用于此类电视节目推荐系统的本发明并不局限于此,而是还可以用于推荐其它音频/视频图片(即多媒体内容),或者可以帮助查找度假目的地、酒店、旅行线路、书籍等,即可以在任何需要作出决定的场合下为用户提供帮助。
图1示出了家用服务器用户界面内的建议引擎1的配置,其中建议引擎1用于提供建议的电子节目指南条目,该电子节目指南条目是从电子节目指南条目数据库4中检索的。建议引擎1包括检索单元3,其连接到电子节目指南条目数据库4,并在多模式用户界面5上提供建议的电子节目指南条目,该多模式用户界面5包括图形、语音、触觉、触感和动画人物以及这些当中的任何子集。建议引擎1还包括简档器2,其连接到检索单元3。简档器2构建用户简档,并依此作为一个查询提供给检索单元3,该检索单元3从EPG条目数据库4中检索与该查询最匹配的条目。然后将这些最匹配的条目作为建议的EPG条目通过图形用户界面(GUI)5提供给用户。
图1还示出了EPG条目数据库4的一个示范EPG条目4a,其涉及广播的电视表演,日期为2002年7月18日,开始时间为22:00,结束时间为22:45,在“频道5”台上播出,标题为“极限运动”。再者,该EPG条目4a提供有所述电视表演的描述“意大利火山岛乌尔卡诺为一些艰苦运动包括山地跑、皮艇和山地自行车提供了使人筋疲力尽的背景”。图1还示出了由简档器2作为用户简档生成的示范查询2a。该查询是一个加权词的集合(即词加权对),并包括体育:2.12,户外:2.04,皮艇:1.90,网球:1.39,探险:1.21,西部片:0.83,新闻:0.78以及枪战:0.50。查询可以包括未示出的另外的词加权对。
图2示出了用于构建此类用户简档或作为词加权对列表查询的结构。简档器2有权访问包含用户观看过的节目的EPG条目的用户行为数据库6和数据库7以检索附加信息,这将在下文进一步描述。基于这两个信息源,简档器2生成用户简档8,该用户简档8产生例如可以类似于图1所示查询2a的查询。
现在参考图3a至3c描述根据本发明计算关键词的加权和由此得到的建议的改进方法,该方法也改进了建议。对于这个计算,还将一个特殊集合的用户特点纳入考虑,也用于计算根据本发明的建议。在所描述的示范实施例中,本发明的目的是能够对想看电视的用户提供明确的建议。机制是根据EPG条目确定相关的关键词,即节目描述,这里指相关数据的各自描述和电视表演的摘要、所确定的相关关键词的加权方案、以及将将来的电视表演的相关EPG条目标识为建议的搜索。
在此实施例中,表示个人用户的典型惯常行为的用户特点可以是:
·首选频道,
·观看电视的典型时间(星期几、日时间,周末、银行休假日、...),
·换频道的行为,例如,如果一个表演只被观看了非常短的时间,这只可能意味着用户不喜欢它,而当用户明确地在一个表演开始时切换到一个频道并观看完该表演然后才关闭或切换到另一个频道时,则意味着用户可能喜欢该表演;加权z(i)能反映出就换频道行为而言用户喜欢一个特定表演或节目的程度,
·表演的长度,例如,当电影持续2个钟头时,可能会有差异,用户是想在傍晚还是在深夜观看该表演,
·广播连续剧的频度和观看该连续剧的频度之间的关系,
·打开电视的时间,即,它是整天开着还是它专门针对特定电视表演;在第一种情况中,所选节目可能具有较低的加权,
·记录的内容,
·多久以后才观看记录的内容,
·观看记录节目的频度,例如隔多久完全观看它一次;对应的加权r(i)可以反映就这些问题而言用户喜欢特定表演的程度,
·也能将用户的情绪纳入考虑,
·电影制作的年份,
·导演、演员、演员对或演员组,
·标题,
·类型,
·用户输入的实际希望观看的节目。
打开电视后,用户的典型行为(例如转换到几个特定频道)可以根据过去获知,并可以在打开电视之后提供即时建议。由于表示用户的典型惯常行为的用户特点受历史的影响,并且不只使用历史的特定条目生成建议,根据本发明可以建议新的内容。
还可以提供明确地惊喜建议,不刻意地与简档相吻合。这些惊喜被随意选择或是用户或简档的近似匹配,或者故意与用户简档相反,或者基于定型用户简档从因特网服务器上获取它们,或者直接将它们包含在EPG中。
关于这一点,还可以在简档内归类,即不是保持特定关键词构建简档,一个简档也可以由加权的非常特定的简档构成,例如对于古典音乐的简档、极限运动的简档等。由此,可以确保建议引擎能利用特定简档中的信息归纳数据。例如,如果用户喜欢听贝多芬,则他/她可能也喜欢莫扎特。如果不曾选择过有关莫扎特的内容,则不能从用户历史中获知此信息,但是在古典音乐的特定简档中,可以对莫扎特和贝多芬之间的相关性建模,以便根据本发明的建议中,除贝多芬外,还可能出现莫扎特。这种建模可建立在EPG数据中或其它文本资源(例如新闻组或其它讨论音乐、电影或电视节目的文章)中词的同现的基础上,可以用于扩展在简档中所用关键词的集合。还可以使用同音词和同义词。特别地查找用户简档的关键词扩展的这些和其它的可能性,可以包含在如图2所示的简档2有权访问的数据库7中。另一个实例可以假设詹姆斯·邦德和米歇尔·菲佛同时出现在此类文本中,如果用户最近已经观看了几次詹姆斯·邦德,则应该将詹姆斯·邦德和米歇尔·菲佛都添加到他的简档中。再者,可以按有规律的间隔从因特网服务器下载此类同现列表。这些可以在最近电视节目的环境下基于几个较大用户群的行为计算。
根据本发明的所描述的优选实施例,利用上述特点的用户简档的计算和包含在所选EPG条目中的关键词的重要度,可以按如下方式计算:
用户历史由所选的EPG条目(其意味着这些EPG条目对应于用户观看过的节目)和上述用户特点组成。图3a示出了在第一步S1中,读取由一组条目组成的历史。在实例中,第一个条目包括关键词:流行、音乐、摇滚、麦当娜、音乐,第二个条目包括关键词:贝多芬、交响乐、莫扎特、古典,第三个条目包括关键词:朋克、摇滚、音乐,以及第四个条目包括关键词:古典、交响乐团、音乐。
基于特定的用户要求,例如“周末的电影”,可以首先过滤用户历史,以使仅满足此要求的EPG条目留下,下文将对此予以详细说明。如果用户要求的是例如“周末的电影”,则在进行过滤之前,首先判断周末与工作日之间的观看行为是否有较大的区别。可以相对于例如长度、电影类型(例如动作片、恐怖片对言情片)、频道或其它用户特点来判断较大区别。当然,可以确定完整的用户历史,并在稍后阶段根据特定用户要求执行过滤,下文也将予以详细阐述。又或者,不采用完整的历史,而是只利用对应于过滤的条目的历史来确定用户历史。
在随后对于每个词(也称为项)的步骤S2中(图3a-c中未示出),存在于包含在完整或过滤后的用户历史中的条目的至少一项中,对应于每个条目计算加权。根据本发明的此加权反映出用户对该词特别的感兴趣或缺乏兴趣。该加权可以反映用户简档与出现的“正常”频率的关系。计算加权的词可以是存在于条目中的所有词,或缩减的词集合,例如通过用停止词列表过滤例如不包含条目或其它不重要的词而得到的。
词相对于条目的加权最好是该词相对于该条目的重要度与该词相对于所有选择的条目的重要度的乘积,即历史乘该词相对于完整数据库的重要度乘与条目的长度和该词的频率相关的校正系数。一个实例为:
wi(t)=重要度(i,t)*重要度(S,t)*重要度(D,t)*corr(i,t),
其中t是该词,i是条目,S是选择,即用户历史的所有条目,以及D是数据库。上述对于词/条目、词/选择、词/数据库的重要度函数通常是不同的。例如,词相对于条目的重要度可以是它在该条目中出现的次数,词相对于选择(即历史)的重要度可以是该词在选择中所有词集合中所占份额,而词相对于数据库的重要度可以是反向文档频率。如上所述,这三个函数只是实例。可以选用不同的函数。
函数的重要度(S,t)和重要度(D,t)还可以取决于条目即i。对于重要度(S,t),还可以只选择一个常量系数。除相对于选择的重要度外,所有其它的系数都是优选的,但是可任选,换言之,将重要度(i,t)、重要度(D,t)和corr(i,t)用于计算加权w(i,t)完全是可任选的。如果词t出现在数据库的大多数文档中并且因此不是非常特定的,则相对于完整数据库也取决于条目的重要度,即重要度(i,t)通常得到0,或者如果该词只对某些条目非常特定,则得到1。可以取0和1之间的连续值,反映是否该词t是或多或少特定的。上述函数的具体实例为:
其中a是此选择中项t的重要度;t是项,即该词;fi,t是词t在条目i中出现的次数;fi是条目i的文档长度;ft是包含词t的条目的数量;以及N是数据库中条目的数量。
加权w(i,t)可以通过加权r(i)和z(i)进行标准化,即该加权反映用户就记录的表演是否被完整观看过、观看的频度以及多久才观看记录的内容而言对特定表演的喜欢程度,并且该加权反映就转换频道行为而言对特定表演或节目的喜欢程度。
如果词t没有出现在特定条目i中,则加权wi(t)=0。
在图3a中,词音乐、古典、摇滚和流行在第一至第四个条目中的加权以实例方式进行如下计算:词音乐的加权,在第一个条目中为1.2*1*1*0.9=1.08,在第二个条目中为0,在第三个条目中为1*1*1*0.8=0.8,以及在第四个条目中为1*1*1*0.8=0.8;词古典的加权,在第一个条目中为0,在第二个条目中为1*1*1*04=0.4,在第三个条目中为0,以及在第四个条目中为1*1*1*0.7=0.7;词摇滚的加权,在第一个条目为1*1*1*0.7=0.7,在第二个条目中为0,在第三个条目中为1*1*1*0.8=0.8,以及在第四个条目中为0;以及词流行的加权,在第一个条目为1*1*1*0.5=0.5,在第二个条目中为0,在第三个条目中为0,以及在第四个条目中为0。
在如下第三步S3中,单个词t相对于一个条目的加权wi(t)在选择的所有条目i中取平均,以得到该词的最终加权w(t)。在图3a所示实例中,对于词音乐,得到最终加权(1.08+0.0+0.8+0.8)/4=0.67,即w(音乐)=0.67;对于词古典,得到最终加权(0.0+0.4+0.0+0.7)/4=0.275,即w(古典)=0.275;对于词摇滚,计算最终加权w(t)为(0.7+0.0+0.8+0.0)/4=0.375=w(摇滚);以及对于词流行,计算最终加权为(0.5+0.0+0.0+0.0)/4=0.125=W(流行)。
基于上述在数据库(例如文本数据库)中的同现而可以添加到用户简档的词,可以得到启发式加权。例如,如果用户观看过詹姆斯·邦德的电影,而且该关键词常与米歇尔·菲佛共同出现,则即使在没有肖恩·康纳利的情况下米歇尔·菲佛从未/很少出现,w(米歇尔·菲佛)仍将与w(肖恩·康纳利)有某种分数关系。
在如下第四步S4中,如图3b所示,用户简档被确定为历史中具有对应加权的所有项的集合,以便用户简档于是词加权对的集合组成。它可以包含所有词及其加权,或者可以采用具有最高加权的词的子集以使计算开销维持在较小的水平。
在图3b中,根据步骤S3的计算,用户简档显示如下项目:音乐:0.67;摇滚:0.375;古典:0.275;以及流行:0.125。
为简明起见,利用确定条目i中词t的加权的如下函数wi(t),来确定图3a和图3b所示的具体实例中的用户历史:
然后将根据上述描述生成的用户简档作为查询q,该查询q用于在数据库中搜索对应于用户的将来可能选择的EPG条目,即根据本发明提供的可能建议。一般来说,可使用任何可用的信息检索算法,只要用户简档中的词的加权可以被视为影响搜索结果的辅助因子(co-factor)即可。下文中,描述了修改的OKAPI加权的一个示范实施例,其中对于每个与满足用户要求相关的EPG条目都计算OKAPI加权,例如“周末的电影”。在加权的计算过程中,每个匹配词具有其加权作为辅助因子,以便根据用户简档的信息(即用户的偏好)影响搜索结果,从而得到:
其中条目i现在来自完整的EPG条目的将来数据库并且还有所有记录的电视表演。修改公式以确定OKAPI加权(如Wilkinson等人的上述文献中所述的方法)在于加权w(t)的插入,即根据本发明的所有wi(t)的平均。根据此公式,获得高加权的那些EPG条目都包含用户简档中具有高加权(即具有高重要度)的词。
其它的可能解决方案中,对修改的OKAPI加权公式化的另一种可能性是:
因此,在如下步骤S5中,如图3c所示,对于数据库中对应于当前、将来或记录的节目(即用户可以观看到的节目)的每个条目,特别在用户指定的时间范围内,例如预设的“现在”或“周末”,计算用户简档的修改的OKAPI加权。典型地,包含词“古典音乐”的i条目在修改后的OKAPI加权计算中得到0.945;包含词“摇滚音乐”的j条目将在修改的OKAPI加权中得到1.045;以及包含词“英国音乐”的k条目在修改后的OKAPI加权中得到0.67。出于简明的目的,采用如下公式:
来计算这些值,其中q是简档,i是数据库的条目。
备选或另外,可以将如下确定相关关键词及其加权的方案应用于确定相关和不相关的关键词。这种确定基于利用反向文档频率idf(的函数)的项(或关键词)的重要度的已知确定,其中idf定义为整个数据库中的文档数量除以涉及该项的文档的数量。通常取此值的对数LOG(),也称为idf。如果一个项具有高idf值,则这基本表示它不常出现在该文档集合中,并且对于包含该项的几个文档可能非常具有象征意义。
根据本发明,至此用户观看过的表演的EPG数据的集合可以被视为一个独立的文档集合,并可以对包含在该用户数据库中的所有项计算idf统计数字。然后将两个根据熟知技术计算的idf统计数字与基于用户迄今观看过的表演的EPG数据计算的idf统计数字彼此进行比较。如果一个词在这两个文档集合中具有相似关联性,则这表示该词没有很好地在整个EPG数据库所表征的“普通”电视观众与特定用户之间进行区别,并且因此不应给予太高的加权。作为一个实例,用户碰巧刚好跟普通用户一样经常观看新闻,并且这对于用户简档不是特别相关。因此,此类项被给予较低的加权,尽管它们可能很少并在其它情况中会赋予高的加权。另一方面,如果在用户特定数据库同全局EPG数据库相比中,一个词以较低idf加权出现,即较高的文档频率,则可以得出结论:单就此关键词而言,该用户明显偏离普通用户,并且在将来可能会喜欢观看更多此关键词对应的节目。因此,在这些情况中,词的加权将加大。如果选择某个给定的词的次数大大少于用户预期的次数,则可以赋予“反关键词”属性,即对应于用户观看次数少于平均数的节目,因此在推荐中应该避免它。如此确定的词加权可以且应该与根据主数据库计算的标准idf加权一起使用。通过组合,对于在主数据库中不常出现而在用户EPG数据中常出现的词赋予最高加权。
如上所述,可以利用从DVD、数据库、因特网等获得的描述来强化用户历史中的信息。再者,可以利用负面实例来构建负面简档,该负面简档是指包含不应选择的特殊集合的词的表演或节目。而且,可以设置一个功能,以允许用户指示“不再建议该表演”。可能出现一个讨厌的情况是,得到与用户简档匹配的表演的建议,但是出于某些其它原因实际上用户并不喜欢。还有,可以检查EPG条目本身,在关键词前它们是否含有某些负面词,如“不”。
还可以考虑用户是有规律地还是(几乎)不间断地观看特定电视表演,例如某位导演的或有某个(某群)演员的连续剧或电影,以进行建议,而不考虑OKAPI加权的实际值。
再者,为了提供产生更适合的建议或该用户的更多的用户特定简档,可以根据下文用详细描述的类别来拆分用户历史:
将对于家庭不同成员的不同历史保存在一起,例如小孩最可能喜欢与父母喜欢的类型不同的电视表演。根据在一个电视机上观看过的所有表演计算简档,而不管谁观看的,将产生不适合于例如父亲的非常“漫无边际”的建议。利用不同的简档可以确保提供依需要建议的人而定的适当的建议。实际上是谁在观看电视可以通过注册过程、从用户列表中进行简单的选择来确定,或者在不想这样的情况下,如果设备配备有语音接口,则通过说话者识别技术来确定。还可以利用照相机、指纹传感器或某些其它生物统计信息来识别用户。
可以根据日时间或星期几或根据本发明的任何其它用户特点,保存不同的历史和/或简档。例如根据星期几或时间,可能观看不同类型的表演。这应该在简档中捕捉到,以便当用户某个特定时间需要它们时提供适当建议。如果识别用户的上述可能性都没有,则这可以通过假定家庭的不同成员具有不同的“典型电视观看时间”来缓解识别的问题。要注意的是,这可以是上述用户历史过滤的另一种应用,下文将对此予以进一步说明。
如果用户请求涉及将来的电视表演,例如,“明天晚上的电影”,则应该将从现在到明天晚上为止的所有电影纳入考虑,并且如果需要的话,将它们记录下来。
因为根据本发明的上述方面,用户简档、关键词、时间、特定简档方面的加权给出了它们的相对重要度的概念,所以这使仅基于几个用户历史样本并且还基于一个大用户历史来创建合理的用户简档成为可能。这使得系统能够捕获用户的长期兴趣、暂时兴趣以及这些兴趣的逐渐及突然的改变。
在下文中,将参考图4a和4b、结合电视节目建议系统的用户简档的适应实例,描述本发明的第二方面。在例如家庭环境中,在用户组提供例如电视节目的推荐的系统的情况下,最好执行用户简档的演化(evolution)。可以这样做,因为首次使用该系统时,用户的习惯是未知的,并且当可获得更多的用户参考数据时,应该从未知的初始状态演化为细粒度用户简档。再者,如果没有识别有多少用户使用该推荐系统的明确方式,则自动生成的用户简档将是所有用户个人简档的混和。因此,根据本发明,如果可获得足够数据,则将混和的简档分成基本的个人子简档。
在此系统中,当首次使用该系统时,通常初始用户简档是一个通用“定型”简档,也简称为定型。定型是典型用户的简档,并且通常以用户的主要兴趣例如体育、音乐、电影等为条件。但是通用定型是更加特定的定型简档的混和,并且描述了对每个节目的平均兴趣,例如可能关注的“蓝筹股”,如希区柯克电影、BBC、纪录片、温布尔顿决赛等。除通用定型之外,可以有一组特定定型简档,也分别称为特定定型,描述关注体育或文化或好莱坞电影等的用户的兴趣。最终的用户简档可以是通用定型、特定定型和用户特定简档(即用户简档)的线性组合,其起初常常是空的,然后在线性组合中具有初始加权0。
当获得更多的用户数据时,该数据将用于构建用户简档。但是,详细的用户简档可能需要非常多的使用数据,以致于仅使用数天或数周之后,在许多情况中仍不可能获得足够的数据。因此,虽然用户简档的加权设为随数据量的增加而增加,但是大多数简档的线性组合的总加权还是来源于特定定型简档,而通用定型的加权则设为减少。通过将用户数据与各定型中的数据相匹配,并在发现匹配的情况下将加权加到定型,来计算每个特定定型的加权。在接收到大量数据之后,通用定型的加权将接近于零,特定定型的加权将是低的,而用户简档的加权将接近于1。此阶段的用户简档包含有关用户偏好(如由他的观看行为表达出的)的细粒度信息。当得到更多的数据时,将不断地更新用户简档。
图4a示出了根据本发明从最初用于为用户提供建议的通用简档到最终用户简档的平滑过渡,其以实例方式示出了某些段时间过后的几个简档及其各自的加权。现可用的简档有新闻简档、体育简档、恐怖片简档、古典音乐简档、通用/普通用户简档,即通用定型,以及用户特定简档,即根据本发明的用户简档。新闻简档具有初始相关加权0,即在起始时间t=0时,在t=数小时之后,第一个加权为0;在t=1天之后,第二个加权为0.03;并在t=1周之后稳定地增加到第三个加权0.05;而在t=数月之后稳定地减少到第四个加权0。体育简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.03;在t=1天之后,第二个加权为0.09;在t=1周之后稳定地增加到第三个加权0.1,而在t=数月之后稳定地减少到第四个加权0。恐怖片简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.01;在t=1天之后,第二个加权为0.01;在t=1周之后稳定地增加到第三个加权0.05;而在t=数月之后稳定地减少到第四个加权0。古典音乐简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.06;在t=1天之后,第二个加权为0.07;在t=1周之后稳定地增加到第三个加权0.2,而在t=数月之后稳定地减少到第四个加权0。通用定型在起始时间t=0时具有初始加权1.0;在t=数小时之后,第一个加权为0.9;在t=1天之后,第二个加权为0.7;在t=1周之后稳定地增加到第三个加权0.1,而在t=数月之后稳定地减少到第四个加权0。用户简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0;在t=1天之后,第二个加权为0.1;在t=1周之后稳定地增加到第三个加权0.5;而在t=数月之后稳定地增加到第四个加权1。
为了概述并简化,从包含具有所有相同低加权X的词加权对的通用定型简档开始。使用该系统的用户越多,则包含在简档中具有加权大于X的词加权对越多。因此,具有加权为X的初始通用词加权对的整体关联性随时间减少。
如果推荐系统未接收到没有附在其上的用户识别标签的用户数据,即如果没有用户识别装置嵌入在设备中或提供给设备,其具有适应用户简档的特征,则通常用户简档实际包含许多子用户简档即使用该系统的所有用户的线性组合。根据本发明,最好将这些子用户简档从多用户简档即从许多子用户简档的线性组合中分离出来。根据本发明,基于用户特点(例如基于如日时间或周时间等辅助信息)进行正确的用户简档的分离和选择。将用户简档分离成两个子简档最好按如下描述的进行。
如上所述,用户简档本身是由来自用户主动观看过的表演的EPG数据的加权关键词集合来定义的。为了找出根据用户特点的正确拆分,例如使用如日时间的辅助信息,沿着一天内的任意时间进行初步拆分,并初步生成两个子用户简档。检查这两个子用户简档,找出它们的相对差异,并存储该差异。然后,再沿着一天内的另一时间进行初步拆分,并再次评估和存储差异,依此类推。在尝试了所有的可能拆分(或合理数量的拆分)之后,选择两个子用户简档之间产生最大差异的拆分,并分析这两个子用户简档之间的差异。如果它超过预定义的阈值,则进行多用户简档的拆分;否则,多用户简档保持不变,因为它看上去就此用户特点而言只与一个用户相关。
可以通过查看作为其中所含关键词上的离散概率分布的用户简档,来计算两个子用户简档之间的差异。在初步拆分之后,将有两个此类离散概率分布。这二者之间的差异可以利用对称KL距离(Kullback-Leibler-distance)之和(Pi*log(Pi/Pj))来计算,其中发生零次的事件应该由一个虚拟发生的事件取代,两者都避免数值问题并避免过分夸大单个事件的重要度。
图4b示范性地示出了这种拆分,其中t>6个月之后,例如根据图4a生成的多用户特定简档的拆分,被拆分成N个子简档,即从用户简档9生成第一子用户简档101、第二子用户简档102,依此类推直到第N子用户简档10N。通过基于每个生成的子用户简档重复上述将一个用户简档拆分成两个子用户简档的过程,即将一个子用户简档拆分成两个新的子用户简档,依此类推,来生成两个以上的子用户简档。
下文中,描述本发明的第三个方面,根据该第三个方面,可以基于用户特点提供对于个人用户更适当的建议,以避免不适合于当前情况的太泛泛的建议。作为一个实例,某个用户可能喜欢体育、恐怖片和新闻,但是当与朋友在一起时,他们也观看游戏表演。在一周的工作日内,用户通常只观看新闻和特殊的体育比赛,而不看恐怖片和游戏表演。用户只在周末观看这些节目。因此用户简档和/或历史包括所有四个主题。在一周的工作日内,总是从系统得到建议的游戏表演和恐怖片是有点讨厌的,因为用户从不在一周的工作日内观看这些节目。但是,在周末则是非常有用的。
因此,本发明提供一种交互地影响系统提供的建议的装置,以明确地例如请求对于周末或对于立刻播放的一些游戏表演等的一些建议。根据本发明,根据基于用户特点表示的用户的实际情况进行归类,例如按日时间、周时间(今天、明晚、周末)、流派、特定表演、用户情绪、假日、访客、对于家庭、对于自己的建议、直到明晚的每个节目等来归类。用户的情绪可以自动从声音(即说话)或视觉(即模拟照相机)、信息或直接附在人体上的其它生物传感器来检测。
通常,如上所述,用户历史包含关于用户观看过的电视表演的所有信息,即EPG条目、标题、流派、时间、日期、导演、艺术家等。用户简档包含加权的关键词,该加权关键词描述其观看兴趣,并是在EPG中实际搜索的基础以便提供特定的建议。根据本发明实现交互地影响建议的装置的一个可能方式(在下文中称为交互式建议引擎)为,首先基于特定的实际情况或来自用户的请求(例如周末的电影)来过滤用户历史,并基于过滤后的历史来计算特定用户简档,如图5a所示。在第一步S10(其对应于图3a所示的第一步骤S1)中,收集用户数据。然后在第二步S11(其对应于图3a中所示的第二步骤S2(图3中未示出))中,计算完整的用户历史。之后,在第一过滤步骤14a中,生成过滤器设置,其中用户历史应该根据该过滤器设置进行过滤,并且在后续的第二过滤步骤14b中,运用这些过滤器设置以在之后的步骤S11b中获取专用的用户历史。根据此专用用户历史,在后续步骤S12b中导出专用用户简档,并在此基础上,最后在最后一步S13b得到专用建议。
当然,生成的特定用户简档还可以通过某些加权机制与用整个历史计算的通用用户简档、通用定型简档或特殊的定型简档相结合。
或者,可以为同一用户就不同情况下的观看行为创建不同的用户简档,即可以通过过滤获得专用的用户简档。此情况如图5b所示,该图示出在第一步S10(其对应于图3a所示的第一步S1),收集用户数据,并在后续的第二步S11(其对应于如图3a所示的第二步S2),计算用户历史,然后在后续步骤S12(其对应于图3a和图3b所示的第三步S3和第四步S4),导出完整的用户简档。之后,执行第一过滤步骤S14a,以建立过滤器设置,其中用户历史应该根据该过滤器设置进行过滤,并执行后续的第二过滤步骤S14b,以运用这些过滤器设置,以在之后的步骤S12b获取专用的用户简档,基于此在最后的步骤S13b获得专用建议。此技术还可以用于不同家庭成员的各种简档之间的区分,如图5a所示。还可以通过发音者识别或其它生物技术来确定用户的身份,如上所述。
另一个可能性是,利用包含每种节目(即恐怖片、新闻、体育和游戏表演)的用户简档,按常规方式(即图3a至图3c所示的)来计算所有建议。然后基于用户的当前需求,过滤所得到的建议集合。此情况如图5c所示,在第一步S10(其对应于图3a所示的第一步S1),首先收集用户数据,并在后续的第二步S11(其对应于如图3a所示的第二步S2),计算用户历史,然后在后续步骤S12(其对应于图3a和图3b所示的第三步S3和第四步S4),基于此导出用户简档,并在步骤S13(其对应于图3c所示的第五步S5)基于此获得建议。建立过滤器设置的第一过滤步骤S14a仅在获得建议之后执行,并相对于获得的建议建立过滤器设置。在后续第二过滤步骤S14b,应用过滤器设置,以在最后一步S13b获得专用建议。
在两个后面的情况中,用户简档保存用户只在周六和周日观看恐怖片和在一周的工作日中观看新闻和体育等的信息,并且也编写查询,以便只将相关的因素纳入考虑,如图5b所示;如前所述利用完整简档进行查询,并且然后过滤结果,如图5c所示。
如上所述,图5a所示的第一个可能性是只利用历史中的相关部分并从其中计算新的用户简档。
当然,用户的当前需求可以由用户明确地输入,例如“今晚给我播放所有恐怖片”,或者也可以自动获知这些用户当前需求。
根据本发明,建议引擎可以对用户的请求作出适当的反应,例如“任何连续剧”相对于“我习惯观看的任何连续剧”。
而且,系统获知用户是否几乎每次都观看很少播放(例如每2个月一次)的特定表演。在此情况中,即使基于简档会建议该表演,仍会基于上述特定规则向用户建议它。
Claims (69)
1.用于根据电子节目指南向用户提供节目建议的方法,所述方法包括下列步骤:
从电子节目指南条目数据库(4)中检索电子节目指南条目,
根据所检索的电子节目指南条目以及根据用户简档(2)向所述用户建议至少一个电子节目指南条目(5),
其特征在于,在首次提供建议时,所述用户简档对应于通用用户简档;在第一预定周期内,在数据收集期间,所述用户简档对应于所述通用用户简档和个人用户简档的线性组合;以及此后,所述用户简档对应于所述个人用户简档;
其中所述个人用户简档(2)包括词加权对列表(2a),其中根据代表典型惯常行为的用户特点来计算所述加权。
2.如权利要求1所述的方法,其特征在于以下步骤:根据用户历史评估所述用户特点的影响。
3.如权利要求1或2所述的方法,其特征在于以下步骤:根据定型用户简档的特征将所述用户简档分成子用户简档。
4.如权利要求1或2所述的方法,其特征在于如下步骤:基于所述用户先前选择的节目描述中所含的词,确定要包含在所述词加权对列表中的词。
5.如权利要求4所述的方法,其特征在于如下步骤:基于已经包含在所述词加权对列表中的词的同现的数据库评估,确定要包含在所述词加权对列表中的另外词。
6.如权利要求4所述的方法,其特征在于如下步骤:计算要包含在所述词加权对列表中的词的加权,这基于所述词就所有可用的节目描述而言的反向文档频率与所述词就用户先前选择的节目描述而言的反向文档频率的比较。
7.如权利要求4所述的方法,其特征在于:包括如下步骤:计算要包含在所述词加权对列表中的词的加权,采用所述词就用户先前选择的所有节目描述而言的重要度,
与如下项的至少一项的乘积
·常数项,具体来说为1,
·所述词就其中包含所述词的节目描述而言的重要度,
·所述词就所有可用的节目描述而言的重要度,以及
·校正系数,它取决于其中含有所述词的节目描述的长度和所
述词在此节目描述中的频率。
8.如权利要求7所述的方法,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是基于所述词在所述用户的先前选择的节目描述的所有词集合中所占份额来确定的。
9.如权利要求8所述的方法,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
10.如权利要求7所述的方法,其特征在于:所述词就其中包含所述词的节目描述而言的重要度,是基于所述词在所述节目描述中的出现来确定的。
11.如权利要求7所述的方法,其特征在于:所述词就所有可用节目描述而言的重要度,是基于其就所有可用节目描述而言的反向文档频率来确定的。
12.如权利要求11所述的方法,其特征在于:一个词就所有可用节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
13.如权利要求7所述的方法,其特征在于如下步骤:根据如下公式计算要包含在所述词加权对列表中的词的加权:
其中wi(t)是词t在节目描述i中的加权;α是所述词t在所述用户的先前选择的所有节目描述中的重要度;t是所述词;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含所述词t的节目描述的数量;以及N是数据库中节目描述的数量。
14.如权利要求7所述的方法,其特征在于如下步骤:根据用户保持选择以及关断选择或仅对于此选择关/开的行为,对包含在所述词加权对列表中的词的加权进行标准化。
15.如权利要求7所述的方法,其特征在于如下步骤:根据何时实际对记录的选择进行消费的用户行为,对包含在所述词加权对列表中的词的加权进行标准化。
16.如权利要求7所述的方法,其特征在于如下步骤:将一个词在用户先前选择的、出现所述词的所有节目描述中的加权取平均,得到所述词在新简档中的加权。
17.如权利要求7所述的方法,其特征在于如下步骤:将显示加权低于预定阈值或在加权的预定的较低范围内的词从所述词加权对列表中排除。
18.如权利要求6所述的方法,其特征在于如下步骤:通过将用户的负面选择纳入考虑来计算要包含在所述词加权对列表中的词的加权。
19.如权利要求6所述的方法,其特征在于如下步骤:通过将就某些用户特点而言的可能用户选择的最大频率纳入考虑,来计算要包含在词加权对列表中的词的加权。
20.如权利要求4所述的方法,其特征在于:所创建的用户简档用作在可能的将来节目描述中的查询,以向用户建议至少一个可能的将来选择。
21.如权利要求20所述的方法,其特征在于:对于每个可能的将来节目描述,计算修改的OKAPI加权,其中每个匹配词都有其作为辅助因子的加权,以便根据所述用户简档影响搜索结果。
24.如权利要求3所述的方法,其特征在于:所述定型用户简档包括通用定型简档和至少一个特定定型简档,其中所述通用定型简档描述对每个节目的平均兴趣,各特定定型简档定义关注特定主题的用户的兴趣。
25.如权利要求24所述的方法,其特征在于:在所述线性组合以提供所述建议期间与特定定型简档一起纳入考虑的加权通过如下方式计算:将用户选择与相应的特定定型简档中的数据相匹配,并且如果发现匹配,则增加所述相应的特定定型简档的加权。
26.如权利要求22或23所述的方法,其特征在于:在第二预定周期之后,通过个人用户简档来构建所述查询。
27.如权利要求20所述的方法,其特征在于:在将过滤的用户简档纳入考虑的情况下,来构建所述查询。
28.如权利要求1或2所述的方法,其中所述用户简档包含更通用的关键结构。
29.如权利要求28所述的方法,其特征在于:所述通用关键结构包括遗忘因子。
30.如前面权利要求1-2中任何一项所述的方法,其特征在于:将来节目包括存储的个人内容。
31.如前面权利要求1-2中任何一项所述的方法,其特征在于:它用于音频/视频节目建议引擎中。
32.如权利要求31所述的方法,其特征在于:所述音频/视频节目建议引擎是基于因特网的。
33.如前面权利要求1-2中任何一项所述的方法,其特征在于:它是基于客户的。
34.如前面权利要求1-2中任何一项所述的方法,其特征在于:所述用户特点包括如下特点的一项或多项:
·用户消费的音频/视频节目的首选频道;
·用户消费音频/视频节目的典型时间;
·用户消费音频/视频节目相对于所述音频/视频节目的总长度的长度;
·用户开始消费音频/视频节目相对于所述音频/视频节目的开始时间的时间;
·用户消费音频/视频节目相对于消费时间的典型长度;
·特定音频/视频节目可消费的频度与用户消费的频度之间的关系;
·用户的惯常音频/视频节目消费行为,具体涉及打开时间和使用音频/视频设备的时间长短;
·用户记录的音频/视频节目;
·用户记录特定音频/视频节目与用户消费所述音频/视频节目之间的持续时间;
·用户的实际情绪;
·用户输入的实际希望的音频/视频节目;
·用户消费的音频/视频节目的制作年份;
·用户消费的音频/视频节目的导演和/或演员和/或演员组;
·用户消费的音频/视频节目的类型;以及
·用户消费的音频/视频节目的标题。
35.用于根据电子节目指南向用户提供节目建议的装置,所述装置包括:
从电子节目指南条目数据库(4)中检索电子节目指南条目的单元,
根据所述检索的电子节目指南条目以及根据用户简档(2)向所述用户建议至少一个电子节目指南条目(5)的单元,
其特征在于
用户简档单元,其中在首次提供建议时,所述用户简档对应于通用用户简档;在第一预定周期内,在数据收集期间,所述用户简档对应于所述通用用户简档和个人用户简档的线性组合;以及此后,所述用户简档对应于所述个人用户简档;
其中所述个人用户简档(2)包括词加权对列表(2a),其中根据代表典型惯常行为的用户特点来计算所述加权。
36.如权利要求35所述的装置,还包括用于根据用户历史评估所述用户特点的影响的单元。
37.如权利要求35或36所述的装置,还包括根据定型用户简档的特征将所述用户简档分成子用户简档的单元。
38.如权利要求35或36所述的装置,还包括基于所述用户先前选择的节目描述中所含的词确定要包含在所述词加权对列表中的词的单元。
39.如权利要求38所述的装置,还包括基于已经包含在所述词加权对列表中的词的同现的数据库评估确定要包含在所述词加权对列表中的另外词的单元。
40.如权利要求38所述的装置,还包括计算要包含在所述词加权对列表中的词的加权的单元,这基于所述词就所有可用的节目描述而言的反向文档频率与所述词就用户先前选择的节目描述而言的反向文档频率的比较。
41.如权利要求38所述的装置,还包括执行如下功能的单元:计算要包含在所述词加权对列表中的词的加权,采用所述词就用户先前选择的所有节目描述而言的重要度,
与如下项的至少一项的乘积
·常数项,具体来说为1,
·所述词就其中包含所述词的节目描述而言的重要度,
·所述词就所有可用的节目描述而言的重要度,以及
·校正系数,它取决于其中含有所述词的节目描述的长度和所述词在此节目描述中的频率。
42.如权利要求41所述的装置,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是基于所述词在所述用户的先前选择的节目描述的所有词集合中所占份额来确定的。
43.如权利要求42所述的装置,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
44.如权利要求41所述的装置,其特征在于:所述词就其中包含所述词的节目描述而言的重要度,是基于所述词在所述节目描述中的出现来确定的。
45.如权利要求41所述的装置,其特征在于:所述词就所有可用节目描述而言的重要度,是基于其就所有可用节目描述而言的反向文档频率来确定的。
46.如权利要求45所述的装置,其特征在于:一个词就所有可用节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
47.如权利要求41所述的装置,还包括执行如下功能的单元:根据如下公式计算要包含在所述词加权对列表中的词的加权:
其中wi(t)是词t在节目描述i中的加权;α是所述词t在所述用户的先前选择的所有节目描述中的重要度;t是所述词;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含所述词t的节目描述的数量;以及N是数据库中节目描述的数量。
48.如权利要求41所述的装置,还包括根据用户保持选择以及关断选择或仅对于此选择关/开的行为对包含在所述词加权对列表中的词的加权进行标准化的单元。
49.如权利要求41所述的装置,还包括根据何时实际对记录的选择进行消费的用户行为对包含在所述词加权对列表中的词的加权进行标准化的单元。
50.如权利要求41所述的装置,其特征在于还包括将一个词在用户先前选择的、出现所述词的所有节目描述中的加权取平均,得到所述词在新简档中的加权的单元。
51.如权利要求41所述的装置,还包括将显示加权低于预定阈值或在加权的预定的较低范围内的词从所述词加权对列表中排除的单元。
52.如权利要求40所述的装置,还包括通过将用户的负面选择纳入考虑来计算要包含在所述词加权对列表中的词的加权的单元。
53.如权利要求40所述的装置,还包括通过将就某些用户特点而言的可能用户选择的最大频率纳入考虑,来计算要包含在词加权对列表中的词的加权的单元。
54.如权利要求38所述的装置,其特征在于:所创建的用户简档用作在可能的将来节目描述中的查询,以向用户建议至少一个可能的将来选择。
55.如权利要求54所述的装置,还包括针对每个可能的将来节目描述计算修改的OKAPI加权的单元,其中每个匹配词都有其作为辅助因子的加权,以便根据所述用户简档影响搜索结果。
58.如权利要求37所述的装置,其特征在于:所述定型用户简档包括通用定型简档和至少一个特定定型简档,其中所述通用定型简档描述对每个节目的平均兴趣,各特定定型简档定义关注特定主题的用户的兴趣。
59.如权利要求58所述的装置,其特征在于:在所述线性组合以提供所述建议期间与特定定型简档一起纳入考虑的加权通过如下方式计算:将用户选择与相应的特定定型简档中的数据相匹配,并且如果发现匹配,则增加所述相应的特定定型简档的加权。
60.如权利要求56或57所述的装置,还包括用于在第二预定周期之后通过个人用户简档来构建所述查询的单元。
61.如权利要求54所述的装置,其特征在于:在将过滤的用户简档纳入考虑的情况下来构建所述查询的单元。
62.如权利要求35或36所述的装置,其中所述用户简档包含词加权对列表或更通用的关键结构。
63.如权利要求62所述的装置,其特征在于:所述通用关键结构包括遗忘因子。
64.如前面权利要求35-36中任何一项所述的装置,其特征在于:将来节目包括存储的个人内容。
65.如前面权利要求35-36中任何一项所述的装置,其特征在于:它用于音频/视频节目建议引擎中。
66.如权利要求65所述的装置,其特征在于:所述音频/视频节目建议引擎是基于因特网的。
67.如前面权利要求35-36中任何一项所述的装置,其特征在于:它是基于客户的。
68.如前面权利要求35-36中任何一项所述的装置,其特征在于:所述用户特点包括如下特点的一项或多项:
·用户消费的音频/视频节目的首选频道;
·用户消费音频/视频节目的典型时间;
·用户消费音频/视频节目相对于所述音频/视频节目的总长度的长度;
·用户开始消费音频/视频节目相对于所述音频/视频节目的开始时间的时间;
·用户消费音频/视频节目相对于消费时间的典型长度;
·特定音频/视频节目可消费的频度与用户消费的频度之间的关系;
·用户的惯常音频/视频节目消费行为,具体涉及打开时间和使用音频/视频设备的时间长短;
·用户记录的音频/视频节目;
·用户记录特定音频/视频节目与用户消费所述音频/视频节目之间的持续时间;
·用户的实际情绪;
·用户输入的实际希望的音频/视频节目;
·用户消费的音频/视频节目的制作年份;
·用户消费的音频/视频节目的导演和/或演员和/或演员组;
·用户消费的音频/视频节目的类型;以及
·用户消费的音频/视频节目的标题。
69.创建含有词加权对列表的用户简档的简档器,其特征在于包括如前述权利要求35至68中任何一项所定义的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02019492A EP1395056A1 (en) | 2002-08-30 | 2002-08-30 | Methods to create a user profile and to specify a suggestion for a next selection of the user |
EP02019492.4 | 2002-08-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1679331A CN1679331A (zh) | 2005-10-05 |
CN100508592C true CN100508592C (zh) | 2009-07-01 |
Family
ID=31197879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038201607A Expired - Fee Related CN100508592C (zh) | 2002-08-30 | 2003-08-27 | 创建用户简档和为用户提供节目建议的方法、装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7593921B2 (zh) |
EP (3) | EP1395056A1 (zh) |
JP (1) | JP2005536814A (zh) |
CN (1) | CN100508592C (zh) |
WO (1) | WO2004021706A1 (zh) |
Families Citing this family (120)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2864858A1 (fr) * | 2004-01-06 | 2005-07-08 | Thomson Licensing Sa | Dispositif et procede de creation de condenses de documents multimedias |
US20050210507A1 (en) * | 2004-03-17 | 2005-09-22 | Sony Corporation | System and method for multimedia playlist |
US8677419B2 (en) * | 2004-07-05 | 2014-03-18 | Panasonic Corporation | Program search device |
US8943537B2 (en) * | 2004-07-21 | 2015-01-27 | Cox Communications, Inc. | Method and system for presenting personalized television program recommendation to viewers |
WO2006046167A2 (en) * | 2004-10-25 | 2006-05-04 | Koninklijke Philips Electronics N.V. | Associative content exchange/copy mechanism |
JP2006173715A (ja) * | 2004-12-13 | 2006-06-29 | Victor Co Of Japan Ltd | 番組自動選択装置 |
US20060242016A1 (en) * | 2005-01-14 | 2006-10-26 | Tremor Media Llc | Dynamic advertisement system and method |
US8438142B2 (en) | 2005-05-04 | 2013-05-07 | Google Inc. | Suggesting and refining user input based on original user input |
EP1732013A1 (en) * | 2005-06-06 | 2006-12-13 | Deutsche Thomson-Brandt Gmbh | Method and device for searching a data unit in a database |
JP2007096560A (ja) * | 2005-09-28 | 2007-04-12 | Hitachi Ltd | ユーザ嗜好抽出装置 |
WO2007056344A2 (en) * | 2005-11-07 | 2007-05-18 | Scanscout, Inc. | Techiques for model optimization for statistical pattern recognition |
CN101326823A (zh) * | 2005-11-30 | 2008-12-17 | 皇家飞利浦电子股份有限公司 | 产生用于至少一个另外的内容项的推荐的方法和系统 |
US8863221B2 (en) | 2006-03-07 | 2014-10-14 | Samsung Electronics Co., Ltd. | Method and system for integrating content and services among multiple networks |
US8510453B2 (en) | 2007-03-21 | 2013-08-13 | Samsung Electronics Co., Ltd. | Framework for correlating content on a local network with information on an external network |
US8200688B2 (en) | 2006-03-07 | 2012-06-12 | Samsung Electronics Co., Ltd. | Method and system for facilitating information searching on electronic devices |
US8209724B2 (en) | 2007-04-25 | 2012-06-26 | Samsung Electronics Co., Ltd. | Method and system for providing access to information of potential interest to a user |
US8115869B2 (en) | 2007-02-28 | 2012-02-14 | Samsung Electronics Co., Ltd. | Method and system for extracting relevant information from content metadata |
US8843467B2 (en) | 2007-05-15 | 2014-09-23 | Samsung Electronics Co., Ltd. | Method and system for providing relevant information to a user of a device in a local network |
US7630966B2 (en) * | 2006-03-16 | 2009-12-08 | Microsoft Corporation | Media content reviews search |
WO2007124429A2 (en) * | 2006-04-20 | 2007-11-01 | Veveo, Inc. | User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content |
US20080005068A1 (en) * | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
US8327266B2 (en) | 2006-07-11 | 2012-12-04 | Napo Enterprises, Llc | Graphical user interface system for allowing management of a media item playlist based on a preference scoring system |
US9003056B2 (en) | 2006-07-11 | 2015-04-07 | Napo Enterprises, Llc | Maintaining a minimum level of real time media recommendations in the absence of online friends |
US20080051081A1 (en) * | 2006-08-24 | 2008-02-28 | Sony Ericsson Mobile Communications | Profile tracker for portable communication device |
IL178394A (en) * | 2006-09-28 | 2014-12-31 | Deutsche Telekom Ag | Interactive mixed recommendation system |
US20080109391A1 (en) * | 2006-11-07 | 2008-05-08 | Scanscout, Inc. | Classifying content based on mood |
US8935269B2 (en) | 2006-12-04 | 2015-01-13 | Samsung Electronics Co., Ltd. | Method and apparatus for contextual search and query refinement on consumer electronics devices |
US20090055393A1 (en) * | 2007-01-29 | 2009-02-26 | Samsung Electronics Co., Ltd. | Method and system for facilitating information searching on electronic devices based on metadata information |
US8776149B1 (en) * | 2007-03-05 | 2014-07-08 | At&T Intellectual Property I, L.P. | Preference-based media alerts |
US20080228581A1 (en) * | 2007-03-13 | 2008-09-18 | Tadashi Yonezaki | Method and System for a Natural Transition Between Advertisements Associated with Rich Media Content |
US20080227440A1 (en) * | 2007-03-16 | 2008-09-18 | Vinay Kumar Chowdary Settepalli | Methods and apparatus for discovering and updating a mobile device via user behavior |
EP1975866A1 (en) | 2007-03-31 | 2008-10-01 | Sony Deutschland Gmbh | Method and system for recommending content items |
US8086624B1 (en) | 2007-04-17 | 2011-12-27 | Google Inc. | Determining proximity to topics of advertisements |
US8229942B1 (en) | 2007-04-17 | 2012-07-24 | Google Inc. | Identifying negative keywords associated with advertisements |
US9286385B2 (en) | 2007-04-25 | 2016-03-15 | Samsung Electronics Co., Ltd. | Method and system for providing access to information of potential interest to a user |
JP4992973B2 (ja) * | 2007-06-25 | 2012-08-08 | 富士通株式会社 | スコア算出プログラム、スコア算出方法およびスコア算出装置 |
KR101166130B1 (ko) * | 2007-08-30 | 2012-07-23 | 삼성전자주식회사 | 컨텐츠 태그를 이용하여 사용자 프로파일을 구성하는 방법및 장치, 그리고 생성된 사용자 프로파일을 이용하여컨텐츠를 추천하는 방법 |
US8549550B2 (en) * | 2008-09-17 | 2013-10-01 | Tubemogul, Inc. | Method and apparatus for passively monitoring online video viewing and viewer behavior |
US8577996B2 (en) * | 2007-09-18 | 2013-11-05 | Tremor Video, Inc. | Method and apparatus for tracing users of online video web sites |
US8019707B2 (en) | 2007-09-20 | 2011-09-13 | Deutsche Telekom Ag | Interactive hybrid recommender system |
US8176068B2 (en) | 2007-10-31 | 2012-05-08 | Samsung Electronics Co., Ltd. | Method and system for suggesting search queries on electronic devices |
US9060034B2 (en) | 2007-11-09 | 2015-06-16 | Napo Enterprises, Llc | System and method of filtering recommenders in a media item recommendation system |
US8019748B1 (en) * | 2007-11-14 | 2011-09-13 | Google Inc. | Web search refinement |
US8745056B1 (en) | 2008-03-31 | 2014-06-03 | Google Inc. | Spam detection for user-generated multimedia items based on concept clustering |
EP2101501A1 (en) * | 2008-03-10 | 2009-09-16 | Sony Corporation | Method for recommendation of audio |
US8782179B2 (en) * | 2008-04-04 | 2014-07-15 | Microsoft Corporation | Communication workspace |
US20090259551A1 (en) * | 2008-04-11 | 2009-10-15 | Tremor Media, Inc. | System and method for inserting advertisements from multiple ad servers via a master component |
US9077933B2 (en) | 2008-05-14 | 2015-07-07 | At&T Intellectual Property I, L.P. | Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system |
US9202460B2 (en) | 2008-05-14 | 2015-12-01 | At&T Intellectual Property I, Lp | Methods and apparatus to generate a speech recognition library |
US8504558B2 (en) * | 2008-07-31 | 2013-08-06 | Yahoo! Inc. | Framework to evaluate content display policies |
US9269090B2 (en) * | 2008-08-18 | 2016-02-23 | Nokia Technologies Oy | Method, apparatus and computer program product for providing indications regarding recommended content |
US8938465B2 (en) | 2008-09-10 | 2015-01-20 | Samsung Electronics Co., Ltd. | Method and system for utilizing packaged content sources to identify and provide information based on contextual information |
US9612995B2 (en) | 2008-09-17 | 2017-04-04 | Adobe Systems Incorporated | Video viewer targeting based on preference similarity |
US20100088152A1 (en) * | 2008-10-02 | 2010-04-08 | Dominic Bennett | Predicting user response to advertisements |
US20100088177A1 (en) * | 2008-10-02 | 2010-04-08 | Turn Inc. | Segment optimization for targeted advertising |
US8577753B1 (en) * | 2008-10-22 | 2013-11-05 | Amazon Technologies, Inc. | Community-based shopping profiles |
US8244517B2 (en) | 2008-11-07 | 2012-08-14 | Yahoo! Inc. | Enhanced matching through explore/exploit schemes |
US8943081B2 (en) | 2008-11-17 | 2015-01-27 | At&T Intellectual Property I, L.P. | User-powered recommendation system |
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
US8539359B2 (en) * | 2009-02-11 | 2013-09-17 | Jeffrey A. Rapaport | Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic |
US8301624B2 (en) * | 2009-03-31 | 2012-10-30 | Yahoo! Inc. | Determining user preference of items based on user ratings and user features |
US20100293567A1 (en) * | 2009-05-15 | 2010-11-18 | Neuralitic Systems | Method and system for remote control interactions analytics |
US20110016119A1 (en) * | 2009-07-15 | 2011-01-20 | Alcatel-Lucent Usa Inc. | System and method for managing user profiles |
US8612435B2 (en) * | 2009-07-16 | 2013-12-17 | Yahoo! Inc. | Activity based users' interests modeling for determining content relevance |
GB2473261A (en) * | 2009-09-08 | 2011-03-09 | Nds Ltd | Media content viewing estimation with attribution of content viewing time in absence of user interaction |
US20110093783A1 (en) * | 2009-10-16 | 2011-04-21 | Charles Parra | Method and system for linking media components |
EP2502195A2 (en) * | 2009-11-20 | 2012-09-26 | Tadashi Yonezaki | Methods and apparatus for optimizing advertisement allocation |
US8380810B2 (en) * | 2010-03-16 | 2013-02-19 | Nokia Corporation | Method and apparatus providing for output of a content package based at least in part on a content category selection and one or more contextual characteristics |
US8600979B2 (en) | 2010-06-28 | 2013-12-03 | Yahoo! Inc. | Infinite browse |
US20120042263A1 (en) | 2010-08-10 | 2012-02-16 | Seymour Rapaport | Social-topical adaptive networking (stan) system allowing for cooperative inter-coupling with external social networking systems and other content sources |
BR112013004890A2 (pt) | 2010-08-31 | 2016-05-03 | Directv Group Inc | método e sistema para buscar conteúdo em um dispositivo de usuário |
US8612293B2 (en) * | 2010-10-19 | 2013-12-17 | Citizennet Inc. | Generation of advertising targeting information based upon affinity information obtained from an online social network |
CN102004871A (zh) * | 2010-10-21 | 2011-04-06 | 深圳市华曦达科技股份有限公司 | 数字电视终端管理方法和装置 |
US8688706B2 (en) | 2010-12-01 | 2014-04-01 | Google Inc. | Topic based user profiles |
GB2486257B (en) * | 2010-12-09 | 2015-05-27 | Samsung Electronics Co Ltd | Multimedia system and method of recommending multimedia content |
US9204200B2 (en) | 2010-12-23 | 2015-12-01 | Rovi Technologies Corporation | Electronic programming guide (EPG) affinity clusters |
JP5095857B2 (ja) * | 2010-12-28 | 2012-12-12 | シャープ株式会社 | 番組情報通知装置、テレビジョン受像機、番組情報通知方法、番組情報通知プログラム、および記録媒体 |
CN102567408B (zh) | 2010-12-31 | 2014-06-04 | 阿里巴巴集团控股有限公司 | 推荐搜索关键词的方法和装置 |
US9063927B2 (en) | 2011-04-06 | 2015-06-23 | Citizennet Inc. | Short message age classification |
US8676937B2 (en) | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
WO2012162872A1 (en) * | 2011-05-27 | 2012-12-06 | Nokia Corporation | Method and apparatus for collaborative filtering for real-time recommendation |
US8943047B1 (en) * | 2011-09-09 | 2015-01-27 | Intuit Inc. | Data aggregation for qualifying a partner candidate |
US20130080907A1 (en) * | 2011-09-23 | 2013-03-28 | Richard Skelton | Method and system for a personalized content play list |
US20140237589A1 (en) * | 2011-09-29 | 2014-08-21 | Bradley Neal Suggs | Personalization Data of an Active Application |
US9015109B2 (en) | 2011-11-01 | 2015-04-21 | Lemi Technology, Llc | Systems, methods, and computer readable media for maintaining recommendations in a media recommendation system |
US8688719B2 (en) | 2011-11-30 | 2014-04-01 | Microsoft Corporation | Targeted telephone number lists from user profiles |
US8700640B2 (en) * | 2011-11-30 | 2014-04-15 | Telefonaktiebolaget L M Ericsson (Publ) | System or apparatus for finding influential users |
US8584156B2 (en) | 2012-03-29 | 2013-11-12 | Sony Corporation | Method and apparatus for manipulating content channels |
US9384356B2 (en) | 2012-06-29 | 2016-07-05 | Hewlett-Packard Development Company, L.P. | Obscuring internet tendencies |
US20150066940A1 (en) * | 2012-09-10 | 2015-03-05 | Google Inc. | Providing relevant online content |
US10140372B2 (en) | 2012-09-12 | 2018-11-27 | Gracenote, Inc. | User profile based on clustering tiered descriptors |
US9405427B2 (en) * | 2012-09-12 | 2016-08-02 | Facebook, Inc. | Adaptive user interface using machine learning model |
US9129227B1 (en) * | 2012-12-31 | 2015-09-08 | Google Inc. | Methods, systems, and media for recommending content items based on topics |
IN2013MU02217A (zh) * | 2013-07-01 | 2015-06-12 | Tata Consultancy Services Ltd | |
CN103686236A (zh) * | 2013-11-19 | 2014-03-26 | 乐视致新电子科技(天津)有限公司 | 推荐视频资源的方法及系统 |
CN103634617B (zh) * | 2013-11-26 | 2017-01-18 | 乐视致新电子科技(天津)有限公司 | 智能电视中的视频推荐方法及装置 |
US9560399B2 (en) * | 2014-06-13 | 2017-01-31 | Hulu, LLC | Personalized generation of watch list of shows in a video delivery system |
US9928623B2 (en) * | 2014-09-12 | 2018-03-27 | International Business Machines Corporation | Socially generated and shared graphical representations |
US9729910B2 (en) * | 2014-09-24 | 2017-08-08 | Pandora Media, Inc. | Advertisement selection based on demographic information inferred from media item preferences |
US20160127778A1 (en) * | 2014-10-30 | 2016-05-05 | Microsoft Technology Licensing, Llc | Head end detection |
US10698914B2 (en) * | 2015-03-31 | 2020-06-30 | Microsoft Technology Licensing, Llc | Query-by-example for finding similar people |
US9626148B2 (en) * | 2015-06-12 | 2017-04-18 | Alec Edward Rasmussen | Creating an event driven audio file |
CN105872632A (zh) * | 2015-12-01 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 一种个性化节目定制播放方法和装置 |
US10565627B2 (en) * | 2015-12-30 | 2020-02-18 | Google Llc | Systems and methods for automatically generating remarketing lists |
US9781479B2 (en) * | 2016-02-29 | 2017-10-03 | Rovi Guides, Inc. | Methods and systems of recommending media assets to users based on content of other media assets |
US10212464B2 (en) | 2016-04-15 | 2019-02-19 | Hulu, LLC | Generation, ranking, and delivery of actions for entities in a video delivery system |
US10346871B2 (en) * | 2016-04-22 | 2019-07-09 | Facebook, Inc. | Automatic targeting of content by clustering based on user feedback data |
CN107818105B (zh) * | 2016-09-13 | 2021-04-09 | 腾讯科技(深圳)有限公司 | 应用程序的推荐方法及服务器 |
CN108009181B (zh) * | 2016-10-28 | 2021-03-19 | 北京酷我科技有限公司 | 一种电台推荐方法及系统 |
US10846745B1 (en) * | 2016-12-30 | 2020-11-24 | Amazon Technologies, Inc. | Contextual presence |
US10455362B1 (en) | 2016-12-30 | 2019-10-22 | Amazon Technologies, Inc. | Contextual presence |
CN107357835B (zh) * | 2017-06-22 | 2020-11-03 | 电子科技大学 | 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统 |
KR102384215B1 (ko) * | 2017-08-01 | 2022-04-07 | 삼성전자주식회사 | 전자 장치 및 그의 제어방법 |
US10891947B1 (en) | 2017-08-03 | 2021-01-12 | Wells Fargo Bank, N.A. | Adaptive conversation support bot |
CN109903067B (zh) * | 2017-12-08 | 2021-07-16 | 北京京东尚科信息技术有限公司 | 信息处理方法和装置 |
US11171972B1 (en) * | 2018-06-29 | 2021-11-09 | Snap Inc. | Additive friend suggestion for account security |
CN108985900B (zh) * | 2018-07-16 | 2021-06-29 | 广州天高软件科技有限公司 | 基于运营业务的分时推荐方法 |
CN109636538A (zh) * | 2018-12-20 | 2019-04-16 | 成都知数科技有限公司 | 银行产品推荐方法、装置及服务器 |
US10958973B2 (en) * | 2019-06-04 | 2021-03-23 | International Business Machines Corporation | Deriving and identifying view preferences of a user consuming streaming content |
RU2764383C2 (ru) * | 2020-06-19 | 2022-01-17 | Акционерное общество "Лаборатория Касперского" | Система и способ выбора модели описания пользователя |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US8539002B2 (en) * | 2000-03-14 | 2013-09-17 | Koninklijke Philips N.V. | Subjective information record for linking subjective information about a multimedia content with the content |
CN1148675C (zh) * | 2000-06-20 | 2004-05-05 | 国际商业机器公司 | 基于网络的输入系统和方法 |
US20020056091A1 (en) * | 2000-09-13 | 2002-05-09 | Bala Ravi Narayan | Software agent for facilitating electronic commerce transactions through display of targeted promotions or coupons |
US8020183B2 (en) * | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
US7441260B1 (en) * | 2000-09-20 | 2008-10-21 | Koninklijke Philips Electronics, N.V. | Television program recommender with automatic identification of changing viewer preferences |
US20020116710A1 (en) | 2001-02-22 | 2002-08-22 | Schaffer James David | Television viewer profile initializer and related methods |
US20020174429A1 (en) * | 2001-03-29 | 2002-11-21 | Srinivas Gutta | Methods and apparatus for generating recommendation scores |
GB0108354D0 (en) * | 2001-04-03 | 2001-05-23 | Thirdspace Living Ltd | System and method for providing a user with access to a plurality of sevices and content from a broadband television service |
US6859803B2 (en) * | 2001-11-13 | 2005-02-22 | Koninklijke Philips Electronics N.V. | Apparatus and method for program selection utilizing exclusive and inclusive metadata searches |
US20030126108A1 (en) * | 2001-12-31 | 2003-07-03 | Knoinklijke Philips Electronics N.V. | Method and apparatus for access and display of content allowing users to apply multiple profiles |
US7243105B2 (en) * | 2002-12-31 | 2007-07-10 | British Telecommunications Public Limited Company | Method and apparatus for automatic updating of user profiles |
-
2002
- 2002-08-30 EP EP02019492A patent/EP1395056A1/en not_active Ceased
- 2002-08-30 EP EP07017597A patent/EP1860579A1/en not_active Ceased
- 2002-08-30 EP EP09009037A patent/EP2109048A1/en not_active Ceased
-
2003
- 2003-08-27 CN CNB038201607A patent/CN100508592C/zh not_active Expired - Fee Related
- 2003-08-27 WO PCT/EP2003/009473 patent/WO2004021706A1/en active Application Filing
- 2003-08-27 JP JP2004532119A patent/JP2005536814A/ja not_active Withdrawn
- 2003-08-27 US US10/525,665 patent/US7593921B2/en not_active Expired - Fee Related
-
2009
- 2009-07-22 US US12/507,574 patent/US7970762B2/en not_active Expired - Fee Related
Non-Patent Citations (5)
Title |
---|
Management,Elsevier,Barking,GB,Vol.33 No.3. 1997 * |
Self-adaptive User Profiles for Large-scale Data Delivery. Ugur Cetintemel , Michael J. Franklin, C.Lee Giles.Data engineering. 2000 |
Self-adaptive User Profiles for Large-scale Data Delivery. Ugur Cetintemel , Michael J. Franklin, C.Lee Giles.Data engineering. 2000 * |
Stereotypes in information filtering systems. Bracha Shapira, Peretz Shoval, Url Hananl.Information Processing & Management,Elsevier,Barking,GB,Vol.33 No.3. 1997 |
Stereotypes in information filtering systems. Bracha Shapira, Peretz Shoval, Url Hananl.Information Processing & * |
Also Published As
Publication number | Publication date |
---|---|
US7970762B2 (en) | 2011-06-28 |
WO2004021706A1 (en) | 2004-03-11 |
JP2005536814A (ja) | 2005-12-02 |
US20060156326A1 (en) | 2006-07-13 |
US20090282034A1 (en) | 2009-11-12 |
EP1395056A1 (en) | 2004-03-03 |
US7593921B2 (en) | 2009-09-22 |
CN1679331A (zh) | 2005-10-05 |
EP2109048A1 (en) | 2009-10-14 |
EP1860579A1 (en) | 2007-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100508592C (zh) | 创建用户简档和为用户提供节目建议的方法、装置 | |
US9402101B2 (en) | Content presentation method, content presentation device, and program | |
JP5421469B2 (ja) | 対象を定めたテレビ番組配信のためのシステム、プリファレンスエンジン、機械可読媒体およびテレビ視聴習慣を判断する方法 | |
US10984037B2 (en) | Methods and systems for selecting and presenting content on a first system based on user preferences learned on a second system | |
CN1659882B (zh) | 用于完成个人资料档案的内容补充的方法和系统 | |
US20090138326A1 (en) | Apparatus and method for updating user profile | |
US20040073918A1 (en) | Automatic user profiling | |
WO2001015449A1 (en) | Method and apparatus for creating recommendations from users profile built interactively | |
WO2004100033A2 (en) | Apparatus and method for performing profile based collaborative filtering | |
Vildjiounaite et al. | Unobtrusive dynamic modelling of tv programme preferences in a finnish household | |
Vildjiounaite et al. | Unobtrusive dynamic modelling of TV program preferences in a household | |
Takama et al. | Profile generation from tv watching behavior using sentiment analysis | |
WO2012038007A2 (en) | Method for context-aware content recommendations using user contextual micro-profiles pre-filtering and collaborative filtering | |
Andrade et al. | Novel hybrid approach to content recommendation based on predicted profiles | |
Ferman et al. | Multimedia content recommendation engine with automatic inference of user preferences | |
Şamdan | A Graph based collaborative and context aware recommendation system for TV programs | |
De Pessemier et al. | A profile based recommendation system for TV-Anytime annotated content | |
Velusamy et al. | Fuzzy clustering based ad recommendation for TV programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090701 Termination date: 20150827 |
|
EXPY | Termination of patent right or utility model |