CN1679331A - 创建用户简档和为用户的下次选择指定建议的方法 - Google Patents

创建用户简档和为用户的下次选择指定建议的方法 Download PDF

Info

Publication number
CN1679331A
CN1679331A CNA038201607A CN03820160A CN1679331A CN 1679331 A CN1679331 A CN 1679331A CN A038201607 A CNA038201607 A CN A038201607A CN 03820160 A CN03820160 A CN 03820160A CN 1679331 A CN1679331 A CN 1679331A
Authority
CN
China
Prior art keywords
user
weighting
speech
program
predicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038201607A
Other languages
English (en)
Other versions
CN100508592C (zh
Inventor
S·戈伦茨
R·坎佩
C·许英
Z·瓦尔桑
R·门克尔
H·维斯
T·坎普
S·托尔格
M·埃梅勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Deutschland GmbH
Original Assignee
Sony International Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony International Europe GmbH filed Critical Sony International Europe GmbH
Publication of CN1679331A publication Critical patent/CN1679331A/zh
Application granted granted Critical
Publication of CN100508592C publication Critical patent/CN100508592C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/437Administration of user profiles, e.g. generation, initialisation, adaptation, distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/46Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising users' preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/162Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
    • H04N7/163Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Abstract

通过将用户特点的特殊集合纳入考虑,来获得基于此计算的用户简档和/或建议。用户特点定义为表示就使用用户简档的应用方面而言的个人用户的典型惯常行为。换言之,对于使用用户简档的每个应用,定义用户特点的特殊集合,其能表示个人用户的典型惯常行为。基于这些用户特点,在创建用户简档期间,计算或影响在词加权对列表或表示用户简档的加权的关键词中的加权;和/或在根据多用户简档创建个人用户简档期间,拆分多用户简档;和/或在指定建议期间,过滤用于创建用户简档的用户历史、和/或用户简档、和/或建议结果。

Description

创建用户简档和为用户的下次选择指定建议的方法
本发明涉及创建用户简档和为用户的下次选择指定建议(suggestion)的方法,更具体地说,涉及一种用于创建包含词加权对的列表的用户简档的方法、一种用于根据包含词加权对的列表的多用户简档创建个人用户简档的方法、以及一种为用户下次选择指定建议的方法,其中建议是基于建议结果来指定的,该建议结果是为将来的节目描述和用户简档计算的。
已知的几种技术试图对于这些应用的用户的各种内容选择应用都能给出“合理建议”。对于此类建议引擎,通常要对用户及其偏好建模,以便提供最可能的下次内容选择推荐(recommendation)。对用户及其偏好建模的一种通用方法是,利用用户群的预定义定型,该定型表征用户就某些应用和/或主题的兴趣。再者,还广泛采用用户操作的日志记录来推测相应的某些特征。此类推荐系统通常是基于服务器的,并从大量用户收集大量显式评级以构建简档。然后将各用户定位在这些获知的简档的其中之一,并基于该用户可能也喜欢其它用户用于构建喜欢的简档的内容的假设,生成新的可能选择内容的建议。
用户和对应偏好的模型通常是词加权对的列表,即加权的关键词列表,据此搜索新的可能选择以查找最匹配的一个。Ingo Schwab和Alfred Kopsa所著的文献“通过非干扰学习的适应性”(Adaptivitythrough Unobstrusive Learning)(《Künstliche Intelligenz》卷3-02,第5-9页,ISSN 0933-1875)。Arendt Tapp Verlag,Bremen描述了一种方法,用于只从肯定的用户观察结果以隐含方式获知包含此类加权关键词的用户简档。在此文献中,还和用户简档一起描述了几种方法。再有,在Ross Wilkinson、Justin Zobel、Ron Sacks-Davis所著文献“短查询的相似性测定”(similarity measures for short queries)(《Department of Computer Science》,RMIT,GPO Box 2476V,Melbourne 3001,澳大利亚,1995年10月,Fourth Text RetrievalConference(1995),277-285)中,描述了信息检索技术,用于基于或许两到十项的某些关键词查找文章和数据库,特别对于通常较短的随意查询。
如上所述,已知的系统基于现有用户简档和/或用户历史来计算建议,并允许用户可直接编辑用户简档或自动计算该用户简档。同样如上所述,另一个常用的机制是,根据用户群的行为和/或选择将用户分组,其中需要有这些用户就内容的显式评级。然后假定该组中用户所喜欢的对于当前用户也最可能是个好的建议。但是,所有这些方法有一个共同的特点,它们都基于该用户或他所属用户群的整个历史生成非常泛泛的建议。在Conor Hayes、Padraig Cunningham、Patrick Clerkin、Marco Grimaldi所著的文献“节目驱动的音乐收音机”(Program driven music radio)(《Department of Computer Science》,Trinity College Dublin,Proceedings of the ECAI 2002(5thconference onartificial intelligence on 21.to 26.July2002)),其中描述了按照根据当前情况过滤所得到的建议,在流式音频技术和推荐技术中查找与收听者当前的收听偏好相关的更好推荐。这里的当前情况是某个(最近)时窗内用户的行为,以确保建议与用户最终改变的品位相吻合。但是,在此系统中,建议仍可能很泛泛地与当前情况吻合。
根据某个时间段上的观察,对于用户/用户群有效的此类非常泛泛的建议在某些情况下可能并非适合。
因此,本发明的目的在于提出改进技术,用于生成用户简档并用户下次选择指定建议。
本发明的目的通过如下方法解决:根据独立权利要求1的用于创建包含词加权对列表的用户简档的方法;根据独立权利要求29的用于根据包含词加权对列表的多用户简档创建个人用户简档的方法;以及根据独立权利要求33用于为用户下次选择指定建议的方法,其中建议基于建议结果来指定,该建议结果是为将来的节目描述和用户简档计算的。在随后的从属权利要求中定义了其优选实施例。再者,本发明提出一种如独立权利要求38的计算机程序产品;一种如权利要求39的计算机可读存储媒体;一种如权利要求40的用于创建包含词加权对列表的用户简档的简档装置;以及如权利要求41的建议引擎,用于为用户下次选择指定建议,其中建议基于建议结果来指定,该建议结果是为将来的节目描述和用户简档计算的。在权利要求42中定义了建议引擎的优选实施例。
应该注意的是,除如上所述的词加权对(即加权的关键词列表)之外,还可以采用一些更通用的结构,如n字母组(依赖前n个词(停止词除外)的上下文关系的词)。还可以采用包含一个以上词的短语。这些结构称为“关键结构(key structures)”。
还可以采用遗忘因子,即对“旧”关键词(由用户过去的选择所产生的关键词)加权,该关键词被动态地降低加权(取决于它们多久才显示被选择的出现的词)。由此,最近的选择得到较高的加权,因此才有可能与用户兴趣的改变相适应。再者,术语“将来的节目”应该理解为“将来的节目或存储的个人内容”。还有,术语“节目描述”表示还包含”所选内容的描述,例如电视节目简介”。
根据本发明创建包含词加权对列表的用户简档的方法包括如下步骤:基于用户特点(user features)计算加权,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
根据本发明基于包含词加权对列表的多用户简档创建个人用户简档的方法包括如下步骤:基于用户特点将多用户简档至少拆分一次,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
根据本发明用于为用户下次选择指定建议的方法,其中该建议是基于关于将来节目描述和用户简档计算的建议结果确定的,该方法包括如下步骤:基于根据用户特点表示的用户实际情况,过滤用于创建用户简档的用户历史和/或建议结果,该用户特点表示就使用用户简档的应用而言个人用户的典型惯常行为。
由此,根据本发明,通过将用户特点的特殊集合纳入考虑,来获得用户简档以及基于此计算的建议。用户特点定义为,表示就使用用户简档的应用而言个人用户的典型惯常行为。换言之,对于使用用户简档的每种应用,都定义用户特点的特殊集合,它可以表示个人用户的典型惯常行为。基于这些用户特点,在创建用户简档过程中,计算或影响在词加权对列表或加权关键词中的加权;在根据多用户简档创建个人用户简档过程中,拆分多用户简档;或在指定建议过程中,过滤用于创建用户简档的用户历史、和/或用户简档、和或建议结果。
用户特点的选择,须能够表示就特定应用而言个人用户的典型惯常行为,即能够表征用户通常作出选择所依据的预定方案或规则。通过起初对于如现有技术系统中的选择历史进行考虑,根据本发明的方法可以通过改进对用户兴趣的模拟,而非在用户的选择中查找特征,而越来越与个人用户的行为相吻合。
视具体的应用而定,对于依据用户操作推测他的实际喜好,不同的特点是有帮助的/必须的。。这些特点不同于最新的“现有技术水平”。通过选择这些特定的特点,可以实施更复杂的推理,以帮助在更深层面上计算用户偏好。
再者,利用用户历史中的特点,基于用户的实际请求,动态地计算特定的简档。例如,可设想与周末相比,用户在工作日观看不同的电影(可能比较短且不是太另人兴奋)。再者,在周末,下午的观看行为也不同于晚上。所以如果在某周六晚上用户点播某个电影,则从历史中选择所有相关项,并从这些项中计算一个非常特别的简档作为当前建议的依据。
或者,可以利用根据惯常历史计算的简档提出多个节目(例如电视表演)的初始建议。然后根据历史中的特点作进一步的过滤。
根据本发明用于创建用户简档的方法最好包括如下步骤:评估来自用户历史对用户特点的影响。
备选或附加地,根据本发明用于创建用户简档的方法最好还包括如下步骤:根据定型用户简档的特征将用户简档分成子用户简档,以得到更加专用的简档。
另一个备选或附加的是,根据本发明用于创建用户简档的方法最好包括如下步骤:基于用户先前选择的节目描述中所含的词,确定要包含在词加权对列表中的词。
在此情况中,根据本发明用于创建用户简档的方法最好包括如下步骤:基于已经包含在列表中的词的同现的数据库评估,确定要包含在词加权对列表中的另一些词。
备选或附加地,在这种情况下,根据本发明用于创建用户简档的方法最好包括如下步骤:基于某个词就所有可用的节目描述而言的反向文档频率(reverse document frequency)与所述词就用户先前选择的节目描述而言的反向文档频率的比较,计算要包含在词加权对列表中的所述词的加权。
在此情况中,另一个备选或附加地,根据本发明用于创建用户简档的方法最好包括如下步骤:以该项:
·所述词就用户先前选择的所有节目描述而言的重要度;与以下至少一项的乘积来计算要包含在词加权对列表中的词的加权:
·常数项,具体来说为1;
·所述词就其中包含所述词的节目描述而言的重要度;
·所述词就所有可用的节目描述而言的重要度;以及
·校正系数,它与其中含有所述词的节目描述的长度和所述词在该节目描述中的频率相关。
在根据本发明用于创建用户简档的方法中,一个词就用户先前选择的所有节目描述而言的重要度,最好基于所述词在用户先前选择的节目描述的所有词集合中所占比例来确定。
在根据本发明用于创建用户简档的方法中,一个词就所述用户先前选择的所有节目描述而言的重要度,还最好在将包含所述词的节目描述纳入考虑的情况下来确定。
在根据本发明用于创建用户简档的方法中,所述词就与含有所述词的节目描述而言的重要度,最好基于相对于所述词在更大的数据库中的出现次数的所述词在所述节目描述中的出现次数来确定。
在根据本发明用于创建用户简档的方法中,所述词就所有节目描述而言的重要度,最好基于所述词就所有节目描述而言的反向文档频率来确定。
在根据本发明用于创建用户简档的方法中,一个词就所有节目描述而言的重要度,还最好在将包含所述词的节目描述纳入考虑的情况下来确定。
在根据本发明用于创建用户简档的方法中,可以根据下式执行计算要包含在词加权对列表中的词的加权的步骤:
w i ( t ) = ( 1 + 1 2 log ( f i , t f i + 1 ) ) · a · log ( N - f t f t ) · ( f i , t f i , t + f i / avg ( f i ) ) ,
其中wi(t)是词t在节目描述i中的加权;a是所述词t在所述用户的先前选择的所有节目描述中的重要度;t是所述词;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含词t的节目描述的数量;以及N是数据库中节目描述的数量。
在根据本发明用于创建用户简档的方法中,计算加权的步骤最好包括如下步骤:根据用户保持选择以及关断选择(即转换频道的行为)的行为,对包含在所述词加权对列表中的词的计算的加权进行标准化。恰好打开这个选择并正好在结束时关断也起重要的作用。
在根据本发明用于创建用户简档的方法中,备选或附加地,计算加权的步骤最好还包括如下步骤:根据用户何时实际消费记录的选择的行为,对包含在所述词加权对列表中的词的加权进行标准化。
在根据本发明用于创建用户简档的方法中,另一备选或附加地,计算加权的步骤最好还包括如下步骤:将一个词关于其中所述词出现的所述用户先前选择的所有节目描述的取平均。这些是按照对wi(t)取平均来计算的加权w(t)。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:将显示加权低于预定阈值或在加权的预定较低范围内的词从词加权对列表中排除出去。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:通过将用户的负面选择纳入考虑,来计算要包含在所述词加权对列表中的词的加权。
在根据本发明用于创建用户简档的方法中,又一备选或附加地,计算加权的步骤最好还包括如下步骤:将就某些用户特点而言的可能用户选择的最大频率纳入考虑,以计算包含在所述词加权对列表中的词的加权。
在根据本发明用于创建用户简档的方法中,所创建的用户简档最好用作在可能的将来节目描述中的查询,以向用户建议至少一个可能的将来选择。
在此情况中,根据本发明用于创建用户简档的方法,最好对于每个可能的将来节目描述计算修改的OKAPI加权,其中每个匹配词都有作为因子的加权以便根据用户简档影响搜索结果。
在此情况中,根据本发明用于创建用户简档的方法,还最好根据如下公式计算所述修改的OKAPI加权:
OK A mod ified ( q , i ) = Σ t ∈ q ^ t ∈ i w ( t ) · log ( N - f t f t ) · ( f i , t f i , t + f i / avg ( f i ) ) ,
其中w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权,即wi(t)的平均;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含词t的节目描述的数量;以及N是数据库中节目描述的数量。
在此情况中,根据本发明用于创建用户简档的方法,或者最好还根据如下公式计算所述修改的OKAPI加权:
OKA mod ified ( q , i ) = Σ t ∈ q ^ t ∈ i w ( t ) · ( 1 + 1 2 log ( f i , t f i + 1 + 1 ) ) ,
其中w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度。
在此情况中,备选或附加地,根据本发明用于创建用户简档的方法,最好还通过将定型用户简档与创建的用户简档组合来构建查询,其中最初在首次提供建议时,只使用定型用户简档;在收集数据以计算创建的用户简档期间的第一预定时间内,同时使用两种用户简档的线性组合;以及在所述收集数据以计算创建的用户简档期间的第一预定时间之后,使用所述创建的用户简档。
在根据本发明用于创建用户简档的方法中,定型用户简档可以包括描述每个节目的平均兴趣的通用定型简档以及各定义关注特定主题的用户的兴趣的特定定型简档。
在根据本发明用于创建用户简档的方法中,最好加权通过将所述用户选择与所述各特定定型中的数据相匹配并且如果发现匹配则增大所述定型的加权,来计算在线性组合提供所述建议期间与特定定型用户简档一起纳入考虑的加权。
最初还可对于不同的用户群使用几个定型简档。通过对特定用户或行为的少量观察之后,以初始定型的线性组合的形式计算更特定的定型。
在根据本发明用于创建用户简档的方法中,在第二预定周期之后,通过如下面定义和描述所创建的个人用户简档构建所述查询。
在根据本发明用于创建用户简档的方法中,最好将如下面定义和描述的过滤的用户简档纳入考虑来构建所述查询。
在根据本发明用于由多用户简档创建个人用户简档的方法中,最好通过执行如下步骤来拆分所述多用户简档:
a)根据用户特点执行初步拆分,以生成第一和第二子用户简档;
b)计算两个子用户简档之间的相对差异;
c)执行步骤a)和b),直到执行了所有的或预定数目的初步拆分为止;以及
d)如果所述相对差异在预定阈值之上,根据得到最高相对差异的初步拆分,对多用户简档进行拆分。
在根据本发明用于由多用户简档创建个人用户简档的方法中,在所述拆分过程中,最好通过如下方法计算所述相对差异:计算第一子用户简档基于其中所含的用户特点的第一离散概率分布与第二子用户简档基于其中所含的用户特点的第二离散概率分布之差。
在根据本发明用于由多用户简档创建个人用户简档的方法中,在所述拆分过程中,最好还利用对称Kullback-Leibler距离和来计算所述两个离散概率分布的所述差,其中将发生零次的事件以一个虚拟发生的事件替代。
根据本发明的上述各方法,最好用于音频/视频节目建议引擎中。
在根据本发明的上述各方法中,所述音频/视频节目建议引擎最好是基于因特网的。
在根据本发明的上述各方法最好是基于客户的,即它在消费类设备上实现,例如TV、机顶盒、VCR、家用服务器,而不是在因特网服务器或类似的公用服务器上实现。
在根据本发明的上述各方法中,所述用户特点最好包括如下特点的一项或多项:
·用户消费的音频/视频节目的首选频道;
·用户消费的音频/视频节目的典型时间;
·用户消费音频/视频节目相对于所述音频/视频节目的总长度的长度;
·用户开始消费音频/视频节目相对于所述音频/视频节目的开始时间的时间;
·用户消费音频/视频节目相对于消费时间的典型长度;
·某个特定音频/视频节目可消费的频度与用户消费的频度之间的关系;
·用户的惯常音频/视频节目消费行为,具体涉及开启时间和使用音频/视频设备的时间长度;
·用户记录的音频/视频节目;
·用户记录某个特定音频/视频节目与用户消费所述音频/视频节目之间的持续时间;
·用户的实际心情;
·用户输入实际希望的音频/视频节目;
·用户消费的音频/视频节目的制作年份;
·用户消费的音频/视频节目的导演和/或演员和/或演员群;
·用户消费的音频/视频节目的类型;以及
·用户消费的音频/视频节目的标题。
根据本发明的计算机程序产品,包括适合于当在计算机、数字信号处理器等设备上执行时进行如上所述的方法步骤的计算机程序装置。
根据本发明的计算机可读存储媒体在其上存储有上述的计算机程序产品。
根据本发明用于创建含有词加权对列表的用户简档的简档器,适合于执行如上所述的方法步骤。
为用户的下次选择指定建议的建议引擎适合于执行上面描述和定义的为用户的下次选择指定建议的方法步骤,根据本发明,所述建议是基于关于将来节目描述和用户简档计算的建议结果确定的。
根据本发明的建议引擎最好包括根据本发明的简档器。
下文将参考附图以示范实施例的方式说明本发明。
图1示出了用于家用服务器用户界面的建议引擎的配置;
图2示出了图1所示的简档的配置;
图3a至3c示出了根据本发明第一方面的用户简档生成及其用于提出建议的应用;
图4a和图4b示出了根据本发明第二方面的用户简档的适应和拆分;
图5a至图5c示出了根据本发明第三方面的交互地影响建议引擎的三种可能性。
在下文中,在向家庭环境中的用户集合提供电视节目的推荐的系统环境中,以实例方式描述本发明。本发明特别适用于这样的系统,因为今天的电视节目的用户面对各种各样的频道和表演,他们要在这些频道和表演之间选择他们想观看或记录的。在因特网上、在电视广播随带的信息流(例如图文电视)或通常在DVB中和机顶盒上提供的电子节目指南(EPG),帮助并协助用户决定观看哪个表演,然而,频道和表演的数量仍然太大。因此,根据本发明为用户提供与他的品位和习惯相吻合的明确建议的引擎,特别适合于确定在特定场合下适合特定用户的建议。当然,事实上特别适用于此类电视节目推荐系统的本发明并不局限于此,而是还可以用于推荐其它音频/视频图片(即多媒体、内容),或者可以帮助查找度假目的地、酒店、旅行线路、书籍等,即可以在任何需要作出决定的场合下为用户提供帮助。
图1示出了家用服务器用户界面内的建议引擎1的配置,其中建议引擎1用于提供建议的电子节目指南条目,该电子节目指南条目是从电子节目指南条目数据库4中检索的。建议引擎1包括检索单元3,其连接到电子节目指南条目数据库4,并在多模式用户界面5上提供建议的电子节目指南条目,该多模式用户界面5包括图形、语音、触觉、触感和动画人物以及这些当中的任何子集。建议引擎1还包括简档器2,其连接到检索单元3。简档器2构建用户简档,并依此作为一个查询提供给检索单元3,该检索单元3从EPG条目数据库4中检索与该查询最匹配的条目。然后将这些最匹配的条目作为建议的EPG条目通过图形用户界面(GUI)5提供给用户。
图1还示出了EPG条目数据库4的一个示范EPG条目4a,其涉及广播的电视表演,日期为2002年7月18日,开始时间为22:00,结束时间为22:45,在“频道5”台上播出,标题为“极限运动”。再者,该EPG条目4a提供有所述电视表演的描述“意大利火山岛乌尔卡诺为一些艰苦运动包括山地跑、皮艇和山地自行车提供了使人筋疲力尽的背景”。图1还示出了由简档器2作为用户简档生成的示范查询2a。该查询是一个加权词的集合(即词加权对),并包括体育:2.12,户外:2.04,皮艇:1.90,网球:1.39,探险:1.21,西部片:0.83,新闻:0.78以及枪战:0.50。查询可以包括未示出的另外的词加权对。
图2示出了用于构建此类用户简档或作为词加权对列表查询的结构。简档器2有权访问包含用户观看过的节目的EPG条目的用户行为数据库6和数据库7以检索附加信息,这将在下文进一步描述。基于这两个信息源,简档器2生成用户简档8,该用户简档8产生例如可以类似于图1所示查询2a的查询。
现在参考图3a至3c描述根据本发明计算关键词的加权和由此得到的建议的改进方法,该方法也改进了建议。对于这个计算,还将一个特殊集合的用户特点纳入考虑,也用于计算根据本发明的建议。在所描述的示范实施例中,本发明的目的是能够对想看电视的用户提供明确的建议。机制是根据EPG条目确定相关的关键词,即节目描述,这里指相关数据的各自描述和电视表演的摘要、所确定的相关关键词的加权方案、以及将将来的电视表演的相关EPG条目标识为建议的搜索。
在此实施例中,表示个人用户的典型惯常行为的用户特点可以是:
·首选频道,
·观看电视的典型时间(星期几、日时间,周末、银行休假日、...),
·换频道的行为,例如,如果一个表演只被观看了非常短的时间,这只可能意味着用户不喜欢它,而当用户明确地在一个表演开始时切换到一个个频道并观看完该表演然后才关闭或切换到另一个频道时,则意味着用户可能喜欢该表演;加权z(i)能反映出就换频道行为而言用户喜欢一个特定表演或节目的程度,
·表演的长度,例如,当电影持续2个钟头时,可能会有差异,用户是想在傍晚还是在深夜观看该表演,
·广播连续剧的频度和观看该连续剧的频度之间的关系,
·打开电视的时间,即,它是整天开着还是它专门针对特定电视表演;在第一种情况中,所选节目可能具有较低的加权,
·记录的内容,
·多久以后才观看记录的内容,
·观看记录节目的频度,例如隔多久完全观看它一次;对应的加权r(i)可以反映就这些问题而言用户喜欢特定表演的程度,
·也能将用户的情绪纳入考虑,
·电影制作的年份,
·导演、演员、演员对或演员组,
·标题,
·类型,
·用户输入的实际希望观看的节目。
打开电视后,用户的典型行为(例如转换到几个特定频道)可以根据过去获知,并可以在打开电视之后提供即时建议。由于表示用户的典型惯常行为的用户特点受历史的影响,并且不只使用历史的特定条目生成建议,根据本发明可以建议新的内容。
还可以提供明确地惊喜建议,不刻意地与简档相吻合。这些惊喜被随意选择或是用户或简档的近似匹配,或者故意与用户简档相反,或者基于定型用户简档从因特网服务器上获取它们,或者直接将它们包含在EPG中。
关于这一点,还可以在简档内归类,即而不是保持特定关键词构建简档,一个简档也可以由加权的非常特定的简档构成,例如对于古典音乐的简档、极限运动的简档等。由此,可以确保建议引擎能利用特定简档中的信息归纳数据。例如,如果用户喜欢听贝多芬,则他/她可能也喜欢莫扎特。如果不曾选择过有关莫扎特的内容,则不能从用户历史中获知此信息,但是在古典音乐的特定简档中,可以对莫扎特和贝多芬之间的相关性建模,以便根据本发明的建议中,除贝多芬外,还可能出现莫扎特。这种建模可建立在EPG数据中或其它文本资源(例如新闻组或其它讨论音乐、电影或电视节目的文章)中词的同现的基础上,可以用于扩展在简档中所用关键词的集合。还可以使用同音词和同义词。特别地查找用户简档的关键词扩展的这些和其它的可能性,可以包含在如图2所示的简档2有权访问的数据库7中。另一个实例可以假设詹姆斯·邦德和米歇尔·菲佛同时出现在此类文本中,如果用户最近已经观看了几次詹姆斯·邦德,则应该将詹姆斯·邦德和米歇尔·菲佛都添加到他的简档中。再者,可以按有规律的间隔从因特网服务器下载此类同现列表。这些可以在最近电视节目的环境下基于几个较大用户群的行为计算。
根据本发明的所描述的优选实施例,利用上述特点的用户简档的计算和包含在所选EPG条目中的关键词的重要度,可以按如下方式计算:
用户历史由所选的EPG条目(其意味着这些EPG条目对应于用户观看过的节目)和上述用户特点组成。图3a示出了在第一步S1中,读取由一组条目组成的历史。在实例中,第一个条目包括关键词:流行、音乐、摇滚、麦当娜、音乐,第二个条目包括关键词:贝多芬、交响乐、莫扎特、古典,第三个条目包括关键词:朋克、摇滚、音乐,以及第四个条目包括关键词:古典、交响乐团、音乐。
基于特定的用户要求,例如“周末的电影”,可以首先过滤用户历史,以使仅满足此要求的EPG条目留下,下文将对此予以详细说明。如果用户要求的是例如“周末的电影”,则在进行过滤之前,首先判断周末与工作日之间的观看行为是否有较大的区别。可以相对于例如长度、电影类型(例如动作片、恐怖片对言情片)、频道或其它用户特点来判断较大区别。当然,可以确定完整的用户历史,并在稍后阶段根据特定用户要求执行过滤,下文也将予以详细阐述。又或者,不采用完整的历史,而是只利用对应于过滤的条目的历史来确定用户历史。
在随后对于每个词(也称为项)的步骤S2中(图3a-c中未示出),存在于包含在完整或过滤后的用户历史中的条目的至少一项中,对应于每个条目计算加权。根据本发明的此加权反映出用户对该词特别的感兴趣或缺乏兴趣。该加权可以反映用户简档与出现的“正常”频率的关系。计算加权的词可以是存在于条目中的所有词,或缩减的词集合,例如通过用停止词列表过滤以例如不包含条目或其它不重要的词而得到的。
词相对于条目的加权最好是该词相对于该条目的重要度与该词相对于所有选择的条目的重要度的乘积,即历史乘该词相对于完整数据库的重要度乘与条目的长度和该词的频率相关的校正系数。一个实例为:
wi(t)=重要度(i,t)*重要度(S,t)*重要度(D,t)*corr(i,t),
其中t是该词,i是条目,S是选择,即用户历史的所有条目,以及D是数据库。上述对于词/条目、词/选择、词/数据库的重要度函数通常是不同的。例如,词相对于条目的重要度可以是它在该条目中出现的次数,词相对于选择(即历史)的重要度可以是该词在选择中所有词集合中所占份额,而词相对于数据库的重要度可以是反向文档频率。如上所述,这三个函数只是实例。可以选用不同的函数。
函数的重要度(S,t)和重要度(D,t)还可以取决于条目即i。对于重要度(S,t),还可以只选择一个常量系数。除相对于选择的重要度外,所有其它的系数都是优选的,但是可任选,换言之,将重要度(i,t)、重要度(D,t)和corr(i,t)用于计算加权w(i,t)完全是可任选的。如果词t出现在数据库的大多数文档中并且因此不是非常特定的,则相对于完整数据库的也取决于条目的重要度,即重要度(D,i,t)通常得到0,,或者如果该词只对某些条目非常特定,则得到1。可以取0和1之间的连续值,反映是否该词t是或多或少特定的。上述函数的具体实例为:
w i ( t ) = ( 1 + 1 2 log ( f i , t f i + 1 + 1 ) ) · a · log ( N - f t f t ) · ( f i , t f i , t + f i / avg ( f t ) ) ,
其中a是此选择中项t的重要度;t是项,即该词;fi,t是词t在条目i中出现的次数;fi是条目i的文档长度;ft是包含词t的条目的数量;以及N是数据库中条目的数量。
加权w(i,t)可以通过加权r(i)和z(i)进行标准化,即该加权反映用户就记录的表演是否被完整观看过、观看的频度以及多久才观看记录的内容而言对特定表演的喜欢程度,并且该加权反映就转换频道行为而言对特定表演或节目的喜欢程度。
如果词t没有出现在特定条目i中,则加权wi(t)=0。
在图3a中,词音乐、古典、摇滚和流行在第一至第四个条目中的加权以实例方式进行如下计算:词音乐的加权,在第一个条目中为1.2*1*1*0.9=1.08,在第二个条目中为0,在第三个条目中为1*1*1*0.8=0.8,以及在第四个条目中为1*1*1*0.8=0.8;词古典的加权,在第一个条目中为0,在第二个条目中为1*1*1*0.4=0.4,在第三个条目中为0,以及在第四个条目中为1*1*1*0.7=0.7;词摇滚的加权,在第一个条目为1*1*1*0.7=0.7,在第二个条目中为0,在第三个条目中为1*1*1*0.8=0.8,以及在第四个条目中为0;以及词流行的加权,在第一个条目为1*1*1*0.5=0.5,在第二个条目中为0,在第三个条目中为0,以及在第四个条目中为0。
在如下第三步S3中,单个词t相对于一个条目的加权wi(t)在选择的所有条目i中取平均,以得到该词的最终加权w(t)。在图3a所示实例中,对于词音乐,得到最终加权(1.08+0.0+0.8+0.8)/4=0.67,即w(音乐)=0.67;对于词古典,得到最终加权(0.0+0.4+0.0+0.7)/4=0.275,即w(古典)=0.275;对于词摇滚,计算最终加权w(t)为(0.7+0.0+0.8+0.0)/4=0.375=w(摇滚);以及对于词流行,计算最终加权为(0.5+0.0+0.0+0.0)/4=0.125=W(流行)。
基于上述在数据库(例如文本数据库)中的同现而可以添加到用户简档的词,可以得到启发式加权。例如,如果用户观看过詹姆斯·邦德的电影,而且该关键词常与米歇尔·菲佛共同出现,则即使没有肖恩·康纳利米歇尔·菲佛从未/很少,w(米歇尔·菲佛)仍将与w(肖恩·康纳利)有某种分数关系。
在如下第四步S4中,如图3b所示,用户简档被确定为历史中具有对应加权的所有项的集合,以便用户简档于是词加权对的集合组成。它可以包含所有词及其加权,或者可以采用具有最高加权的词的子集以使计算开销维持在较小的水平。
在图3b中,根据步骤S3的计算,用户简档显示如下项目:音乐:0.67;摇滚:0.375;古典:0.275;以及流行:0.125。
为简明起见,利用确定条目i中词t的加权的如下函数wi(t),来确定图3a和图3b所示的具体实例中的用户历史:
w i ( t ) = ( 1 + 1 2 log ( f i , t f i + 1 + 1 ) ) · 1 · 1 · ( f i , t f i , t + f i / avg ( f i ) ) .
然后将根据上述描述生成的用户简档作为查询q,该查询q用于在数据库中搜索对应于用户的将来可能选择的EPG条目,即根据本发明提供的可能建议。一般来说,可使用任何可用的信息检索算法,只要用户简档中的词的加权可以被视为影响搜索结果的辅助因子(co-factor)即可。下文中,描述了修改的OKAPI加权的一个示范实施例,其中对于每个与满足用户要求相关的EPG条目都计算OKAPI加权,例如“周末的电影”。在加权的计算过程中,每个匹配词具有其加权作为辅助因子,以便根据用户简档的信息(即用户的偏好)影响搜索结果,从而得到:
OKA mod ified ( q , i ) = Σ t ∈ q ^ t ∈ i w ( t ) · log ( N - f t f t ) · ( f i , t f i , t + f i / avg ( f i ) ) .
其中条目i现在来自完整的EPG条目的将来数据库并且还有所有记录的电视表演。修改公式以确定OKAPI加权(如Wilkinson等人的上述文献中所述的方法)在于加权w(t)的插入,即根据本发明的所有wi(t)的平均。根据此公式,获得高加权的那些EPG条目都包含用户简档中具有高加权(即具有高重要度)的词。
其它的可能解决方案中,对修改的OKAPI加权公式化的另一种可能性是:
OKA mod ified ( q , i ) = Σ i ∈ q ^ t ∈ i w ( t ) · ( 1 + 1 2 log ( f i , t f i + 1 + 1 ) )
因此,在如下步骤S5中,如图3c所示,对于数据库中对应于当前、将来或记录的节目(即用户可以观看到的节目)的每个条目,特别在用户指定的时间范围内,例如预设的“现在”或“周末”,计算用户简档的修改的OKAPI加权。典型地,包含词“古典音乐”的i.条目在修改后的OKAPI加权计算中得到0.945;包含词“摇滚音乐”的j.条目将在修改的OKAPI加权中得到1.045;以及包含词“英国音乐”的k.条目在修改后的OKAPI加权中得到0.67。出于简明的目的,采用如下公式:
OKA mod ified ( q , i ) = Σ t ∈ q ^ t ∈ i w ( t ) · 1 · 1
来计算这些值,其中q是简档,i是数据库的条目。
备选或另外,可以将如下确定相关关键词及其加权的方案应用于确定相关和不相关的关键词。这种确定基于利用反向文档频率idf(的函数)的项(或关键词)的重要度的已知确定,其中idf定义为整个数据库中的文档数量除以涉及该项的文档的数量。通常取此值的对数LOG(),也称为idf。如果一个项具有高idf值,则这基本表示它不常出现在该文档集合中,并且对于包含该项的几个文档可能非常具有象征意义。
根据本发明,至此用户观看过的表演的EPG数据的集合可以被视为一个独立的文档集合,并可以对包含在该用户数据库中的所有项计算idf统计数字。然后将两个根据熟知技术计算的idf统计数字与基于用户迄今观看过的表演的EPG数据计算的idf统计数字彼此进行比较。如果一个词在这两个文档集合中具有相似关联性,则这表示该词没有很好地在整个EPG数据库所表征的“普通”电视观众与特定用户之间进行区别,并且因此不应给予太高的加权。作为一个实例,用户碰巧刚好跟普通用户一样经常观看新闻,并且这对于用户简档不是特别相关。因此,此类项被给予较低的加权,尽管它们可能很少并在其它情况中会赋予高的加权加权。另一方面,如果在用户特定数据库同全局EPG数据库相比中,一个词以较低idf加权出现,即较高的文档频率,则可以得出结论:单就此关键词而言,该用户明显偏离普通用户,并且在将来可能会喜欢观看更多此关键词对应的节目。因此,在这些情况中,词的加权将加大。如果选择某个给定的词的次数大大少于用户预期的次数,则可以赋予“反关键词”属性,即对应于用户观看次数少于平均数的节目,因此在推荐中应该避免它。如此确定的词加权可以且应该与根据主数据库计算的标准idf加权一起使用。通过组合,对于在主数据库中不常出现而在用户EPG数据中常出现的词赋予最高加权。
如上所述,可以利用从DVD、数据库、因特网等获得的描述来强化用户历史中的信息。再者,可以利用负面实例来构建负面简档,该负面简档是指包含不应选择的特殊集合的词的表演或节目。而且,可以设置一个功能,以允许用户指示“不再建议该表演”。可能出现一个讨厌的情况是,得到与用户简档匹配的表演的建议,,但是出于某些其它原因实际上用户并不喜欢。还有,可以检查EPG条目本身,在关键词前它们是否含有某些负面词,如“不”。
还可以考虑用户是有规律地还是(几乎)不间断地观看特定电视表演,例如某位导演的或有某个(某群)演员的连续剧或电影,以进行建议,而不考虑OKAPI加权的实际值。
再者,为了提供产生更适合的建议或该用户的更多的用户特定简档,可以根据下文将详细描述的类别来拆分用户历史:
将对于家庭不同成员的不同历史保存在一起,例如小孩最可能喜欢与父母喜欢的类型不同的电视表演。根据在一个电视机上观看过的所有表演计算简档,而不管谁观看的,将产生不适合于例如父亲的非常“漫无边际”的建议。利用不同的简档可以确保提供依需要建议的人而定的适当的建议。实际上是谁在观看电视可以通过注册过程、从用户列表中进行简单的选择来确定,或者在不想这样的情况下,如果设备配备有语音接口,则通过说话者识别技术来确定。还可以利用照相机、指纹传感器或某些其它生物统计信息来识别用户。
可以根据日时间或星期几或根据本发明的任何其它用户特点,保存不同的历史和/或简档。例如根据星期几或时间,可能观看不同类型的表演。这应该在简档中捕捉到,以便当用户某个特定时间需要它们时提供适当建议。如果识别用户的上述可能性都没有,则这可以通过假定家庭的不同成员具有不同的“典型电视观看时间”来缓解识别的问题。要注意的是,这可以是上述用户历史过滤的另一种应用,下文将对此予以进一步说明。
如果用户请求涉及将来的电视表演,例如,“明天晚上的电影”,则应该将从现在到明天晚上为止的所有电影纳入考虑,并且如果需要的话,将它们记录下来。
因为根据本发明的上述方面,用户简档、关键词、时间、特定简档方面的加权给出了它们的相对重要度的概念,所以这使仅基于几个用户历史样本并且还基于一个大用户历史来创建合理的用户简档成为可能。这使得系统能够捕获用户的长期兴趣、暂时兴趣以及这些兴趣的逐渐及突然的改变。
在下文中,将参考图4a和4b、结合电视节目建议系统的用户简档的适应实例,描述本发明的第二方面。在例如家庭环境中,在用户组提供例如电视节目的推荐的系统的情况下,最好执行用户简档的演化(evolution)。可以这样做,因为首次使用该系统时,用户的习惯是未知的,并且当可获得更多的用户参考数据时,应该从未知的初始状态演化为细粒度用户简档。再者,如果没有识别有多少用户使用该推荐系统的明确方式,则自动生成的用户简档将是所有用户个人简档的混和。因此,根据本发明,如果可获得足够数据,则将混和的简档分成基本的个人子简档。
在此系统中,当首次使用该系统时,通常初始用户简档是一个通用“定型”简档,也简称为定型。定型是典型用户的简档,并且通常以用户的主要兴趣例如体育、音乐、电影等为条件。但是通用定型是更加特定的定型简档的混和,并且描述了对每个节目的平均兴趣,例如可能关注的“蓝筹股”,如希区柯克电影、BBC、纪录片、温布尔顿决赛等。除通用定型之外,可以有一组特定定型简档,也分别称为特定定型,描述关注体育或文化或好莱坞电影等的用户的兴趣。最终的用户简档可以是通用定型、特定定型和用户特定简档(即用户简档)的线性组合,其起初常常是空的,然后在线性组合中具有初始加权0。加权
当获得更多的用户数据时,该数据将用于构建用户简档。但是,详细的用户简档可能需要非常多的使用数据,以致于仅使用数天或数周之后,在许多情况中仍不可能获得足够的数据。因此,虽然用户简档的加权设为随数据量的增加而增加,但是大多数简档的线性组合的总加权还是来源于特定定型简档,而通用定型的加权则设为减少。通过将用户数据与各定型中的数据相匹配,并在发现匹配的情况下将加权加到定型,来计算每个特定定型的加权。在接收到大量数据之后,通用定型的加权将接近于零,特定定型的加权将是低的,而用户简档的加权将接近于1。此阶段的用户简档包含有关用户偏好(如由他的观看行为表达出的)的细粒度信息。当得到更多的数据时,将不断地更新用户简档。
图4a示出了根据本发明从最初用于为用户提供建议的通用简档到最终用户简档的平滑过渡,其以实例方式示出了某些段时间过后的几个简档及其各自的加权。现可用的简档有新闻简档、体育简档、恐怖片简档、古典音乐简档、通用/普通用户简档,即通用定型,以及用户特定简档,即根据本发明的用户简档。新闻简档具有初始相关加权0,即在起始时间t=0时,在t=数小时之后,第一个加权为0;在t=1天之后,第二个加权为0.03;并在t=1周之后稳定地增加到第三个加权0.05;而在t=数月之后稳定地减少到第四个加权0。体育简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.03;在t=1天之后,第二个加权为0.09;在t=1周之后稳定地增加到第三个加权0.1,而在t=数月之后稳定地减少到第四个加权0。恐怖片简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.01;在t=1天之后,第二个加权为0.01;在t=1周之后稳定地增加到第三个加权0.05;而在t=数月之后稳定地减少到第四个加权0。古典音乐简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0.06;在t=1天之后,第二个加权为0.07;在t=1周之后稳定地增加到第三个加权0.2,而在t=数月之后稳定地减少到第四个加权0。通用定型在起始时间t=0时具有初始加权1.0;在t=数小时之后,第一个加权为0.9;在t=1天之后,第二个加权为0.7;在t=1周之后稳定地增加到第三个加权0.1,而在t=数月之后稳定地减少到第四个加权0。用户简档在起始时间t=0时具有初始加权0;在t=数小时之后,第一个加权为0;在t=1天之后,第二个加权为0.1;在t=1周之后稳定地减少到第三个加权0.5;而在t=数月之后稳定地减少到第四个加权1。
为了概述并简化,从包含具有所有相同低加权X的词加权对的通用定型简档开始。使用该系统的用户越多,则包含在简档中具有加权大于X的词加权对越多。因此,具有加权为X的初始通用词加权对的整体关联性随时间减少。
如果推荐系统未接收到没有附在其上的用户识别标签的用户数据,即如果没有用户识别装置嵌入在设备中或提供给设备,其具有适应用户简档的特征,则通常用户简档实际包含许多子用户简档即使用该系统的所有用户的线性组合。根据本发明,最好将这些子用户简档从多用户简档即从许多子用户简档的线性组合中分离出来。根据本发明,基于用户特点(例如基于如日时间或周时间等辅助信息)进行正确的用户简档的分离和选择。将用户简档分离成两个子简档最好按如下描述的进行。
如上所述,用户简档本身是由来自用户主动观看过的表演的EPG数据的加权关键词集合来定义的。为了找出根据用户特点的正确拆分,例如使用如日时间的辅助信息,沿着一天内的任意时间进行初步拆分,并初步生成两个子用户简档。检查这两个子用户简档,找出它们的相对差异,并存储该差异。然后,再沿着一天内的另一时间进行初步拆分,并再次评估和存储差异,依此类推。在尝试了所有的可能拆分(或合理数量的拆分)之后,选择两个子用户简档之间产生最大差异的拆分,并分析这两个子用户简档之间的差异。如果它超过预定义的阈值,则进行多用户简档的拆分;否则,多用户简档保持不变,因为它看上去就此用户特点而言只与一个用户相关。
可以通过查看作为其中所含关键词上的离散概率分布的用户简档,来计算两个子用户简档之间的差异。在初步拆分之后,将有两个此类离散概率分布。这二者之间的差异可以利用对称KL距离(Kullback-Leibler-distance)之和(Pi*log(Pi/Pj))来计算,其中发生零次的事件应该由一个虚拟发生的事件取代,两者都避免数值问题并避免过分夸大单个事件的重要度。
图4b示范性地示出了这种拆分,其中t>6个月之后,例如根据图4a生成的多用户特定简档的拆分,被拆分成N个子简档,即从用户简档9生成第一子用户简档101、第二子用户简档102,依此类推直到第N子用户简档10N。通过基于每个生成的子用户简档重复上述将一个用户简档拆分成两个子用户简档的过程,即将一个子用户简档拆分成两个新的子用户简档,依此类推,来生成两个以上的子用户简档。
下文中,描述本发明的第三个方面,根据该第三个方面,可以基于用户特点提供对于个人用户更适当的建议,以避免不适合于当前情况的太泛泛的建议。作为一个实例,某个用户可能喜欢体育、恐怖片和新闻,但是当与朋友在一起时,他们也观看游戏表演。在一周的工作日内,用户通常只观看新闻和特殊的体育比赛,而不看恐怖片和游戏表演。用户只在周末观看这些节目。因此用户简档和/或历史包括所有四个主题。在一周的工作日内,总是从系统得到建议的游戏表演和恐怖片是有点讨厌的,因为用户从不在一周的工作日内观看这些节目。但是,在周末则是非常有用的。
因此,本发明提供一种交互地影响系统提供的建议的装置,以明确地例如请求对于周末或对于立刻播放的一些游戏表演等的一些建议。根据本发明,根据基于用户特点表示的用户的实际情况进行归类,例如按日时间、周时间(今天、明晚、周末)、流派、特定表演、用户情绪、假日、访客、对于家庭、对于自己的建议、直到明晚的每个节目等来归类。用户的情绪可以自动从声音(即说话)或视觉(即模拟照相机)、信息或直接附在人体上的其它生物传感器来检测。
通常,如上所述,用户历史包含关于用户观看过的电视表演的所有信息,即EPG条目、标题、流派、时间、日期、导演、艺术家等。用户简档包含加权的关键词,该加权关键词描述其观看兴趣,并是在EPG中实际搜索的基础以便提供特定的建议。根据本发明实现交互地影响建议的装置的一个可能方式(在下文中称为交互式建议引擎)为,首先基于特定的实际情况或来自用户的请求(例如周末的电影)来过滤用户历史,并基于过滤后的历史来计算特定用户简档,如图5a所示。在第一步S10(其对应于图3a所示的第一步骤S1)中,收集用户数据。然后在第二步S11(其对应于图3a中所示的第二步骤S2(图3中未示出))中,计算完整的用户历史。之后,在第一过滤步骤14a中,生成过滤器设置,其中用户历史应该根据该过滤器设置进行过滤,并且在后续的第二过滤步骤14b中,运用这些过滤器设置以在之后的步骤S11b中获取专用的用户历史。根据此专用用户历史,在后续步骤S12b中导出专用用户简档,并在此基础上,最后在最后一步S13b得到专用建议。
当然,生成的特定用户简档还可以通过某些加权机制与用整个历史计算的通用用户简档、通用定型简档或特殊的定型简档相结合。
或者,可以为同一用户就不同情况下的观看行为创建不同的用户简档,即可以通过过滤获得专用的用户简档。此情况如图5b所示,该图示出在第一步S10(其对应于图3a所示的第一步S1),收集用户数据,并在后续的第二步S11(其对应于如图3a所示的第二步S2),计算用户历史,然后在后续步骤S12(其对应于图3a和图3b所示的第三步S3和第四步S4),导出完整的用户简档。之后,执行第一过滤步骤S14a,以建立过滤器设置,其中用户历史应该根据该过滤器设置进行过滤,并执行后续的第二过滤步骤S14b,以运用这些过滤器设置,以在之后的步骤S12b获取专用的用户简档,基于此在最后的步骤S13b获得专用建议。此技术还可以用于不同家庭成员的各种简档之间的区分,如图5a所示。还可以通过发音者识别或其它生物技术来确定用户的身份,如上所述。
另一个可能性是,利用包含每种节目(即恐怖片、新闻、体育和游戏表演)的用户简档,按常规方式(即图3a至图3c所示的)来计算所有建议。然后基于用户的当前需求,过滤所得到的建议集合。此情况如图5c所示,在第一步S10(其对应于图3a所示的第一步S1),首先收集用户数据,并在后续的第二步S11(其对应于如图3a所示的第二步S2),计算用户历史,然后在后续步骤S12(其对应于图3a和图3b所示的第三步S3和第四步S4),基于此导出用户简档,并在步骤S13(其对应于图3c所示的第五步S5)基于此获得建议。建立过滤器设置的第一过滤步骤S14a仅在获得建议之后执行,并相对于获得的建议建立过滤器设置。在后续第二过滤步骤S14b,应用过滤器设置,以在最后一步S13获得专用建议。
在两个后面的情况中,用户简档保存用户只在周六和周日观看恐怖片和在一周的工作日中观看新闻和体育等的信息,并且也编写查询,以便只将相关的因素纳入考虑,如图5b所示;如前所述利用完整简档进行查询,并且然后过滤结果,如图5c所示。
如上所述,图5a所示的第一个可能性是只利用历史中的相关部分并从其中计算新的用户简档。
当然,用户的当前需求可以由用户明确地输入,例如“今晚给我播放所有恐怖片”,或者也可以自动获知这些用户当前需求。
根据本发明,建议引擎可以对用户的请求作出适当的反应,例如“任何连续剧”相对于“我习惯观看的任何连续剧”。
而且,系统获知用户是否几乎每次都观看很少播放(例如每2个月一次)的特定表演。在此情况中,即使基于简档会建议该表演,仍会基于上述特定规则向用户建议它。

Claims (44)

1.用于创建包含词加权对列表或更通用的关键结构的用户简档的方法,其特征在于如下步骤:基于用户特点计算加权,该用户特点表示就使用所述用户简档的应用方面而言的个人用户的典型惯常行为。
2.如权利要求1所述的方法,其特征在于以下步骤:根据用户历史评估所述用户特点的影响。
3.如权利要求1或2所述的方法,其特征在于以下步骤:根据定型用户简档的特征将所述用户简档分成子用户简档。
4.如前面权利要求中任何一项所述的方法,其特征在于如下步骤:基于所述用户先前选择的节目描述中所含的词,确定要包含在所述词加权对列表中的词。
5.如权利要求4所述的方法,其特征在于如下步骤:基于已经包含在所述列表中的词的同现的数据库评估,确定要包含在所述词加权对列表中的另外词。
6.如权利要求4或5所述的方法,其特征在于如下步骤:计算要包含在所述词加权对列表中的词的加权,这基于所述词就所有可用的节目描述而言的反向文档频率与所述词就用户先前选择的节目描述而言的反向文档频率的比较。
7.如权利要求4、5或6所述的方法,其特征在于:包括如下步骤:计算要包含在所述词加权对列表中的词的加权,作为
·所述词就用户先前选择的所有节目描述而言的重要度,
与如下项的至少一项的乘积
·常数项,具体来说为1,
·所述词就其中包含所述词的节目描述而言的重要度,
·所述词就所有可用的节目描述而言的重要度,以及
·校正系数,它取决于其中含有所述词的节目描述的长度和所述词在此节目描述中的频率。
8.如权利要求7所述的方法,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是基于所述词在所述用户的先前选择的节目描述的所有词集合中所占份额来确定的。
9.如权利要求8所述的方法,其特征在于:一个词就所述用户先前选择的所有节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
10.如权利要求7、8或9所述的方法,其特征在于:所述词就其中包含所述词的节目描述而言的重要度,是基于所述词在所述节目描述中的出现来确定的。
11.如权利要求7至10的任何一项所述的方法,其特征在于:所述词就所有可用节目描述而言的重要度,是基于其就所有可用节目描述而言的反向文档频率来确定的。
12.如权利要求11所述的方法,其特征在于:一个词就所有可用节目描述而言的重要度,是在将包含所述词的节目描述纳入考虑的情况下来确定的。
13.如权利要求7至12的任何一项所述的方法,其特征在于如下步骤:根据如下公式计算要包含在所述词加权对列表中的词的加权:
w i ( t ) = ( 1 + 1 2 log ( f i , t f i + 1 + 1 ) ) · a · log ( N - f t f t ) · ( f i , t f i , t + f i / avg ( f i ) ) ,
其中wi(t)是词t在节目描述i中的加权;a是所述词t在所述用户的先前选择的所有节目描述中的重要度;t是所述词;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含所述词t的节目描述的数量;以及N是数据库中节目描述的数量。
14.如权利要求7至13的任何一项所述的方法,其特征在于如下步骤:根据用户保持选择以及关断选择或仅对于此选择关/开的行为,对包含在所述词加权对列表中的词的加权进行标准化。
15.如权利要求7至14的任何一项所述的方法,其特征在于如下步骤:根据用户何时实际消费记录的选择的行为,对包含在所述词加权对列表中的词的加权进行标准化。
16.如权利要求7至15的任何一项所述的方法,其特征在于如下步骤:将一个词在用户先前选择的、出现所述词的所有节目描述中的加权wi(t)取平均,得新简档的加权w(t)。
17.如权利要求7至16的任何一项所述的方法,其特征在于如下步骤:将显示加权低于预定阈值或在加权的预定较低范围内的词从所述词加权对列表中排除。
18.如权利要求6至17的任何一项所述的方法,其特征在于如下步骤:通过将用户的负面选择纳入考虑来计算要包含在所述词加权对列表中的词的加权。
19.如权利要求6至18的任何一项所述的方法,其特征在于如下步骤:通过将就某些用户特点而言的可能用户选择的最大频率纳入考虑,来计算要包含在词加权对列表中的词的加权。
20.如权利要求4至19的任何一项所述的方法,其特征在于:所创建的用户简档用作在可能的将来节目描述中的查询,以向用户建议至少一个可能的将来选择。
21.如权利要求20所述的方法,其特征在于:对于每个可能的将来节目描述,计算修改的OKAPI加权,其中每个匹配词都有其作为辅助因子的加权,以便根据所述用户简档影响搜索结果。
22.如权利要求21所述的方法,其特征在于:所述修改的OKAPI加权根据如下公式计算:
Figure A038201600004C1
其中是w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据所述用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度;ft是包含词t的节目描述的数量;以及N是数据库中节目描述的数量。
23.如权利要求21所述的方法,其特征在于:所述修改的OKAPI加权根据如下公式计算:
Figure A038201600005C1
其中是w(t)是用户先前选择的所有节目描述中的词t的加权;q是根据所述用户简档构建的查询;i是可能的将来选择的所有节目描述;w(t)是词t的加权;fi,t是词t在节目描述i中出现的次数;fi是节目描述i的文档长度。
24.如权利要求20至23的任何一项所述的方法,其特征在于:通过将定型用户简档与创建的用户简档相结合来构建所述查询,其中最初在首次提供建议时,只使用定型用户简档;在第一预定周期内,在用于计算创建的用户简档的数据收集期间,使用两种用户简档的线性组合;以及在第一预定周期之后,在用于计算创建的用户简档的数据收集期间,使用创建的用户简档。
25.如权利要求24所述的方法,其特征在于:所述定型用户简档包括通用定型简档和至少一个特定定型简档,其中所述通用定型简档描述对每个节目的平均兴趣,各特定定型简档定义关注特定主题的用户的兴趣。
26.如权利要求25所述的方法,其特征在于:在所述线性组合以提供所述建议期间与特定定型用户简档一起纳入考虑的加权通过如下方式计算:将用户选择与相应的特定定型中的数据相匹配,并且如果发现匹配,则增加所述定型的加权。
27.如权利要求24、25或26所述的方法,其特征在于:在第二预定周期之后,通过根据权利要求29至32的任何一项创建的个人用户简档来构建所述查询。
28.如权利要求20至27的任何一项所述的方法,其特征在于:在将根据权利要求33所述的过滤的用户简档纳入考虑的情况下,来构建所述查询。
29.根据包括词加权对列表的多用户简档创建个人用户简档的方法,其特征在于如下步骤:根据用户特点将所述多用户简档至少拆分一次,其中该用户特点表示就使用所述用户简档的应用而言的个人用户的典型惯常行为。
30.如权利要求29所述的方法,其特征在于:执行如下步骤用于拆分所述多用户简档:
e)根据用户特点进行初步拆分,以生成第一和第二子用户简档;
f)计算所述两个子用户简档之间的相对差异;
g)执行步骤a)和b),直到进行了所有或预定数量的初步拆分为止;以及
h)如果所述相对差异在预定阈值之上,根据得到最高相对差异的初步拆分,对所述多用户简档进行拆分。
31.如权利要求30所述的方法,其特征在于:通过如下方式计算所述相对差异:计算第一子用户简档在其中所含的用户特点上的第一离散概率分布与第二子用户简档在其中所含的用户特点上的第二离散概率分布的差异。
32.如权利要求31所述的方法,其特征在于:利用对称KL距离和来计算所述两个离散概率分布的所述差异,其中将发生零次的事件以一个虚拟发生的事件代替或只有在两个分布中至少出现一次的事件被考虑。
33.为用户的下次选择指定建议的方法,所述建议是基于关于将来节目描述和用户简档计算的建议结果确定的,其特征在于:对如下项进行过滤的步骤:
·用于创建所述用户简档的用户历史,和/或
·所述用户简档,和/或
·所述建议结果
该过滤步骤基于根据用户特点表示的用户的实际情况,该用户特点表示就使用所述用户简档的应用而言的个人用户的典型惯常行为。
34.如前面权利要求中任何一项所述的方法,其特征在于:所述通用关键结构包括遗忘因子。
35.如前面权利要求中任何一项所述的方法,其特征在于:将来节目包括存储的个人内容。
36.如前面权利要求中任何一项所述的方法,其特征在于:它用于音频/视频节目建议引擎中。
37.如权利要求36所述的方法,其特征在于:所述音频/视频节目建议引擎是基于因特网的。
38.如前面权利要求中任何一项所述的方法,其特征在于:它是基于客户的。
39.如前面权利要求中任何一项所述的方法,其特征在于:所述用户特点包括如下特点的一项或多项:
·用户消费的音频/视频节目的首选频道;
·用户消费音频/视频节目的典型时间;
·用户消费音频/视频节目相对于所述音频/视频节目的总长度的长度;
·用户开始消费音频/视频节目相对于所述音频/视频节目的开始时间的时间;
·用户消费音频/视频节目相对于消费时间的典型长度;
·特定音频/视频节目可消费的频度与用户消费的频度之间的关系;
·用户的惯常音频/视频节目消费行为,具体涉及打开时间和使用音频/视频设备的时间长短;
·用户记录的音频/视频节目;
·用户记录特定音频/视频节目与用户消费所述音频/视频节目之间的持续时间;
·用户的实际情绪;
·用户输入的实际希望的音频/视频节目;
·用户消费的音频/视频节目的制作年份;
·用户消费的音频/视频节目的导演和/或演员和/或演员组;
·用户消费的音频/视频节目的类型;以及
·用户消费的音频/视频节目的标题。
40.计算机程序产品,包括当在计算机、微处理器、数字信号处理器等包括家用服务器、机顶盒、TV、VCR和PDA上执行时适合于执行如前述权利要求中任何一项所定义的方法步骤的计算机程序装置。
41.计算机可读存储媒体,其上存储有如权利要求40所述的计算机程序产品。
42.创建含有词加权对列表的用户简档的简档器,其特征在于适合于执行如前述权利要求1至39中任何一项所定义的方法步骤。
43.为用户的下次选择指定建议的建议引擎,所述建议基于关于将来节目描述和用户简档计算的建议结果来确定,其特征在于适合于执行如前述权利要求33至37所定义的方法步骤。
44.如权利要求43所述的建议引擎,其特征在于如权利要求43所述的简档器。
CNB038201607A 2002-08-30 2003-08-27 创建用户简档和为用户提供节目建议的方法、装置 Expired - Fee Related CN100508592C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02019492.4 2002-08-30
EP02019492A EP1395056A1 (en) 2002-08-30 2002-08-30 Methods to create a user profile and to specify a suggestion for a next selection of the user

Publications (2)

Publication Number Publication Date
CN1679331A true CN1679331A (zh) 2005-10-05
CN100508592C CN100508592C (zh) 2009-07-01

Family

ID=31197879

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038201607A Expired - Fee Related CN100508592C (zh) 2002-08-30 2003-08-27 创建用户简档和为用户提供节目建议的方法、装置

Country Status (5)

Country Link
US (2) US7593921B2 (zh)
EP (3) EP2109048A1 (zh)
JP (1) JP2005536814A (zh)
CN (1) CN100508592C (zh)
WO (1) WO2004021706A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004871A (zh) * 2010-10-21 2011-04-06 深圳市华曦达科技股份有限公司 数字电视终端管理方法和装置
WO2012162872A1 (en) * 2011-05-27 2012-12-06 Nokia Corporation Method and apparatus for collaborative filtering for real-time recommendation
CN103686236A (zh) * 2013-11-19 2014-03-26 乐视致新电子科技(天津)有限公司 推荐视频资源的方法及系统
CN105872632A (zh) * 2015-12-01 2016-08-17 乐视网信息技术(北京)股份有限公司 一种个性化节目定制播放方法和装置
CN107078818A (zh) * 2014-10-30 2017-08-18 微软技术许可有限责任公司 头端检测
CN107357835A (zh) * 2017-06-22 2017-11-17 电子科技大学 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统
CN109636538A (zh) * 2018-12-20 2019-04-16 成都知数科技有限公司 银行产品推荐方法、装置及服务器

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2864858A1 (fr) * 2004-01-06 2005-07-08 Thomson Licensing Sa Dispositif et procede de creation de condenses de documents multimedias
US20050210507A1 (en) * 2004-03-17 2005-09-22 Sony Corporation System and method for multimedia playlist
WO2006003766A1 (ja) * 2004-07-05 2006-01-12 Matsushita Electric Industrial Co., Ltd. 番組検索装置
US8943537B2 (en) * 2004-07-21 2015-01-27 Cox Communications, Inc. Method and system for presenting personalized television program recommendation to viewers
WO2006046167A2 (en) * 2004-10-25 2006-05-04 Koninklijke Philips Electronics N.V. Associative content exchange/copy mechanism
JP2006173715A (ja) * 2004-12-13 2006-06-29 Victor Co Of Japan Ltd 番組自動選択装置
US20060242016A1 (en) * 2005-01-14 2006-10-26 Tremor Media Llc Dynamic advertisement system and method
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
EP1732013A1 (en) * 2005-06-06 2006-12-13 Deutsche Thomson-Brandt Gmbh Method and device for searching a data unit in a database
JP2007096560A (ja) * 2005-09-28 2007-04-12 Hitachi Ltd ユーザ嗜好抽出装置
JP2009521736A (ja) * 2005-11-07 2009-06-04 スキャンスカウト,インコーポレイテッド リッチメディアと共に広告をレンダリングするための技術
CN101326823A (zh) 2005-11-30 2008-12-17 皇家飞利浦电子股份有限公司 产生用于至少一个另外的内容项的推荐的方法和系统
US8510453B2 (en) 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8863221B2 (en) 2006-03-07 2014-10-14 Samsung Electronics Co., Ltd. Method and system for integrating content and services among multiple networks
US8200688B2 (en) 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US8843467B2 (en) 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US8209724B2 (en) 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US7630966B2 (en) * 2006-03-16 2009-12-08 Microsoft Corporation Media content reviews search
EP2911071A1 (en) * 2006-04-20 2015-08-26 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
US20080005068A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Context-based search, retrieval, and awareness
US8327266B2 (en) 2006-07-11 2012-12-04 Napo Enterprises, Llc Graphical user interface system for allowing management of a media item playlist based on a preference scoring system
US9003056B2 (en) 2006-07-11 2015-04-07 Napo Enterprises, Llc Maintaining a minimum level of real time media recommendations in the absence of online friends
US20080051081A1 (en) * 2006-08-24 2008-02-28 Sony Ericsson Mobile Communications Profile tracker for portable communication device
IL178394A (en) * 2006-09-28 2014-12-31 Deutsche Telekom Ag Interactive mixed recommendation system
US20080109391A1 (en) * 2006-11-07 2008-05-08 Scanscout, Inc. Classifying content based on mood
US8935269B2 (en) 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US20090055393A1 (en) * 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US8776149B1 (en) * 2007-03-05 2014-07-08 At&T Intellectual Property I, L.P. Preference-based media alerts
US20080228581A1 (en) * 2007-03-13 2008-09-18 Tadashi Yonezaki Method and System for a Natural Transition Between Advertisements Associated with Rich Media Content
US20080227440A1 (en) * 2007-03-16 2008-09-18 Vinay Kumar Chowdary Settepalli Methods and apparatus for discovering and updating a mobile device via user behavior
EP1975866A1 (en) 2007-03-31 2008-10-01 Sony Deutschland Gmbh Method and system for recommending content items
US8086624B1 (en) * 2007-04-17 2011-12-27 Google Inc. Determining proximity to topics of advertisements
US8229942B1 (en) 2007-04-17 2012-07-24 Google Inc. Identifying negative keywords associated with advertisements
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
JP4992973B2 (ja) * 2007-06-25 2012-08-08 富士通株式会社 スコア算出プログラム、スコア算出方法およびスコア算出装置
KR101166130B1 (ko) * 2007-08-30 2012-07-23 삼성전자주식회사 컨텐츠 태그를 이용하여 사용자 프로파일을 구성하는 방법및 장치, 그리고 생성된 사용자 프로파일을 이용하여컨텐츠를 추천하는 방법
US8549550B2 (en) * 2008-09-17 2013-10-01 Tubemogul, Inc. Method and apparatus for passively monitoring online video viewing and viewer behavior
US8577996B2 (en) * 2007-09-18 2013-11-05 Tremor Video, Inc. Method and apparatus for tracing users of online video web sites
US8019707B2 (en) 2007-09-20 2011-09-13 Deutsche Telekom Ag Interactive hybrid recommender system
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US9060034B2 (en) 2007-11-09 2015-06-16 Napo Enterprises, Llc System and method of filtering recommenders in a media item recommendation system
US8019748B1 (en) 2007-11-14 2011-09-13 Google Inc. Web search refinement
US8745056B1 (en) 2008-03-31 2014-06-03 Google Inc. Spam detection for user-generated multimedia items based on concept clustering
EP2101501A1 (en) * 2008-03-10 2009-09-16 Sony Corporation Method for recommendation of audio
US8782179B2 (en) * 2008-04-04 2014-07-15 Microsoft Corporation Communication workspace
US20090259551A1 (en) * 2008-04-11 2009-10-15 Tremor Media, Inc. System and method for inserting advertisements from multiple ad servers via a master component
US9202460B2 (en) 2008-05-14 2015-12-01 At&T Intellectual Property I, Lp Methods and apparatus to generate a speech recognition library
US9077933B2 (en) 2008-05-14 2015-07-07 At&T Intellectual Property I, L.P. Methods and apparatus to generate relevance rankings for use by a program selector of a media presentation system
US8504558B2 (en) * 2008-07-31 2013-08-06 Yahoo! Inc. Framework to evaluate content display policies
US9269090B2 (en) * 2008-08-18 2016-02-23 Nokia Technologies Oy Method, apparatus and computer program product for providing indications regarding recommended content
US8938465B2 (en) 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
US9612995B2 (en) 2008-09-17 2017-04-04 Adobe Systems Incorporated Video viewer targeting based on preference similarity
US20100088177A1 (en) * 2008-10-02 2010-04-08 Turn Inc. Segment optimization for targeted advertising
US20100088152A1 (en) * 2008-10-02 2010-04-08 Dominic Bennett Predicting user response to advertisements
US8577753B1 (en) * 2008-10-22 2013-11-05 Amazon Technologies, Inc. Community-based shopping profiles
US8244517B2 (en) 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
US8943081B2 (en) 2008-11-17 2015-01-27 At&T Intellectual Property I, L.P. User-powered recommendation system
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
US8539359B2 (en) 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
US8301624B2 (en) * 2009-03-31 2012-10-30 Yahoo! Inc. Determining user preference of items based on user ratings and user features
US20100293567A1 (en) * 2009-05-15 2010-11-18 Neuralitic Systems Method and system for remote control interactions analytics
US20110016119A1 (en) * 2009-07-15 2011-01-20 Alcatel-Lucent Usa Inc. System and method for managing user profiles
US8612435B2 (en) * 2009-07-16 2013-12-17 Yahoo! Inc. Activity based users' interests modeling for determining content relevance
GB2473261A (en) * 2009-09-08 2011-03-09 Nds Ltd Media content viewing estimation with attribution of content viewing time in absence of user interaction
US20110093783A1 (en) * 2009-10-16 2011-04-21 Charles Parra Method and system for linking media components
CA2781299A1 (en) * 2009-11-20 2012-05-03 Tadashi Yonezaki Methods and apparatus for optimizing advertisement allocation
US8380810B2 (en) * 2010-03-16 2013-02-19 Nokia Corporation Method and apparatus providing for output of a content package based at least in part on a content category selection and one or more contextual characteristics
US8600979B2 (en) 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
US20120042263A1 (en) 2010-08-10 2012-02-16 Seymour Rapaport Social-topical adaptive networking (stan) system allowing for cooperative inter-coupling with external social networking systems and other content sources
BR112013004890A2 (pt) 2010-08-31 2016-05-03 Directv Group Inc método e sistema para buscar conteúdo em um dispositivo de usuário
US8612293B2 (en) * 2010-10-19 2013-12-17 Citizennet Inc. Generation of advertising targeting information based upon affinity information obtained from an online social network
WO2012075335A2 (en) 2010-12-01 2012-06-07 Google Inc. Recommendations based on topic clusters
GB2486257B (en) * 2010-12-09 2015-05-27 Samsung Electronics Co Ltd Multimedia system and method of recommending multimedia content
US9204200B2 (en) 2010-12-23 2015-12-01 Rovi Technologies Corporation Electronic programming guide (EPG) affinity clusters
JP5095857B2 (ja) * 2010-12-28 2012-12-12 シャープ株式会社 番組情報通知装置、テレビジョン受像機、番組情報通知方法、番組情報通知プログラム、および記録媒体
CN102567408B (zh) 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
US9063927B2 (en) 2011-04-06 2015-06-23 Citizennet Inc. Short message age classification
US8676937B2 (en) 2011-05-12 2014-03-18 Jeffrey Alan Rapaport Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging
US8943047B1 (en) * 2011-09-09 2015-01-27 Intuit Inc. Data aggregation for qualifying a partner candidate
US20130080907A1 (en) * 2011-09-23 2013-03-28 Richard Skelton Method and system for a personalized content play list
US20140237589A1 (en) * 2011-09-29 2014-08-21 Bradley Neal Suggs Personalization Data of an Active Application
US8909667B2 (en) 2011-11-01 2014-12-09 Lemi Technology, Llc Systems, methods, and computer readable media for generating recommendations in a media recommendation system
US8688719B2 (en) 2011-11-30 2014-04-01 Microsoft Corporation Targeted telephone number lists from user profiles
US8700640B2 (en) * 2011-11-30 2014-04-15 Telefonaktiebolaget L M Ericsson (Publ) System or apparatus for finding influential users
US8584156B2 (en) 2012-03-29 2013-11-12 Sony Corporation Method and apparatus for manipulating content channels
WO2014003794A1 (en) * 2012-06-29 2014-01-03 Hewlett-Packard Development Company, L.P. Obscuring internet tendencies
US20150066940A1 (en) * 2012-09-10 2015-03-05 Google Inc. Providing relevant online content
US9405427B2 (en) * 2012-09-12 2016-08-02 Facebook, Inc. Adaptive user interface using machine learning model
US10140372B2 (en) 2012-09-12 2018-11-27 Gracenote, Inc. User profile based on clustering tiered descriptors
US9129227B1 (en) 2012-12-31 2015-09-08 Google Inc. Methods, systems, and media for recommending content items based on topics
IN2013MU02217A (zh) * 2013-07-01 2015-06-12 Tata Consultancy Services Ltd
CN103634617B (zh) * 2013-11-26 2017-01-18 乐视致新电子科技(天津)有限公司 智能电视中的视频推荐方法及装置
US9560399B2 (en) * 2014-06-13 2017-01-31 Hulu, LLC Personalized generation of watch list of shows in a video delivery system
US9928623B2 (en) * 2014-09-12 2018-03-27 International Business Machines Corporation Socially generated and shared graphical representations
US9729910B2 (en) * 2014-09-24 2017-08-08 Pandora Media, Inc. Advertisement selection based on demographic information inferred from media item preferences
US10698914B2 (en) * 2015-03-31 2020-06-30 Microsoft Technology Licensing, Llc Query-by-example for finding similar people
US9626148B2 (en) * 2015-06-12 2017-04-18 Alec Edward Rasmussen Creating an event driven audio file
US10565627B2 (en) * 2015-12-30 2020-02-18 Google Llc Systems and methods for automatically generating remarketing lists
US9781479B2 (en) * 2016-02-29 2017-10-03 Rovi Guides, Inc. Methods and systems of recommending media assets to users based on content of other media assets
US10212464B2 (en) 2016-04-15 2019-02-19 Hulu, LLC Generation, ranking, and delivery of actions for entities in a video delivery system
US10346871B2 (en) * 2016-04-22 2019-07-09 Facebook, Inc. Automatic targeting of content by clustering based on user feedback data
CN107818105B (zh) * 2016-09-13 2021-04-09 腾讯科技(深圳)有限公司 应用程序的推荐方法及服务器
CN108009181B (zh) * 2016-10-28 2021-03-19 北京酷我科技有限公司 一种电台推荐方法及系统
US10846745B1 (en) * 2016-12-30 2020-11-24 Amazon Technologies, Inc. Contextual presence
US10455362B1 (en) 2016-12-30 2019-10-22 Amazon Technologies, Inc. Contextual presence
KR102384215B1 (ko) * 2017-08-01 2022-04-07 삼성전자주식회사 전자 장치 및 그의 제어방법
US10891947B1 (en) 2017-08-03 2021-01-12 Wells Fargo Bank, N.A. Adaptive conversation support bot
CN109903067B (zh) * 2017-12-08 2021-07-16 北京京东尚科信息技术有限公司 信息处理方法和装置
US11171972B1 (en) * 2018-06-29 2021-11-09 Snap Inc. Additive friend suggestion for account security
CN108985900B (zh) * 2018-07-16 2021-06-29 广州天高软件科技有限公司 基于运营业务的分时推荐方法
US10958973B2 (en) * 2019-06-04 2021-03-23 International Business Machines Corporation Deriving and identifying view preferences of a user consuming streaming content
RU2764383C2 (ru) * 2020-06-19 2022-01-17 Акционерное общество "Лаборатория Касперского" Система и способ выбора модели описания пользователя

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US8539002B2 (en) * 2000-03-14 2013-09-17 Koninklijke Philips N.V. Subjective information record for linking subjective information about a multimedia content with the content
CN1148675C (zh) * 2000-06-20 2004-05-05 国际商业机器公司 基于网络的输入系统和方法
US20020056091A1 (en) * 2000-09-13 2002-05-09 Bala Ravi Narayan Software agent for facilitating electronic commerce transactions through display of targeted promotions or coupons
US8020183B2 (en) * 2000-09-14 2011-09-13 Sharp Laboratories Of America, Inc. Audiovisual management system
US7441260B1 (en) * 2000-09-20 2008-10-21 Koninklijke Philips Electronics, N.V. Television program recommender with automatic identification of changing viewer preferences
US20020116710A1 (en) 2001-02-22 2002-08-22 Schaffer James David Television viewer profile initializer and related methods
US20020174429A1 (en) * 2001-03-29 2002-11-21 Srinivas Gutta Methods and apparatus for generating recommendation scores
GB0108354D0 (en) * 2001-04-03 2001-05-23 Thirdspace Living Ltd System and method for providing a user with access to a plurality of sevices and content from a broadband television service
US6859803B2 (en) * 2001-11-13 2005-02-22 Koninklijke Philips Electronics N.V. Apparatus and method for program selection utilizing exclusive and inclusive metadata searches
US20030126108A1 (en) * 2001-12-31 2003-07-03 Knoinklijke Philips Electronics N.V. Method and apparatus for access and display of content allowing users to apply multiple profiles
US7243105B2 (en) * 2002-12-31 2007-07-10 British Telecommunications Public Limited Company Method and apparatus for automatic updating of user profiles

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004871A (zh) * 2010-10-21 2011-04-06 深圳市华曦达科技股份有限公司 数字电视终端管理方法和装置
WO2012162872A1 (en) * 2011-05-27 2012-12-06 Nokia Corporation Method and apparatus for collaborative filtering for real-time recommendation
CN103703460A (zh) * 2011-05-27 2014-04-02 诺基亚公司 用于针对实时推荐的协同过滤的方法和装置
CN103686236A (zh) * 2013-11-19 2014-03-26 乐视致新电子科技(天津)有限公司 推荐视频资源的方法及系统
CN107078818A (zh) * 2014-10-30 2017-08-18 微软技术许可有限责任公司 头端检测
CN105872632A (zh) * 2015-12-01 2016-08-17 乐视网信息技术(北京)股份有限公司 一种个性化节目定制播放方法和装置
CN107357835A (zh) * 2017-06-22 2017-11-17 电子科技大学 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统
CN107357835B (zh) * 2017-06-22 2020-11-03 电子科技大学 一种基于主题模型和遗忘规律的兴趣预测挖掘方法及系统
CN109636538A (zh) * 2018-12-20 2019-04-16 成都知数科技有限公司 银行产品推荐方法、装置及服务器

Also Published As

Publication number Publication date
US7970762B2 (en) 2011-06-28
JP2005536814A (ja) 2005-12-02
EP1860579A1 (en) 2007-11-28
WO2004021706A1 (en) 2004-03-11
CN100508592C (zh) 2009-07-01
EP1395056A1 (en) 2004-03-03
EP2109048A1 (en) 2009-10-14
US7593921B2 (en) 2009-09-22
US20060156326A1 (en) 2006-07-13
US20090282034A1 (en) 2009-11-12

Similar Documents

Publication Publication Date Title
CN1679331A (zh) 创建用户简档和为用户的下次选择指定建议的方法
US10402437B2 (en) System and method for recommending media programs and notifying a user before programs start
CN1233155C (zh) 为一个节目推荐器自动生成查询搜索项的方法和装置
US7519534B2 (en) Speech controlled access to content on a presentation medium
US9477783B2 (en) Profile based content retrieval for recommender systems
JP5032477B2 (ja) ユーザに関心を引くアイテムを推奨するシステムおよび方法
JP2008521315A (ja) ユーザープロファイルを更新するための装置および方法
US20150143394A1 (en) Content presentation method, content presentation device, and program
CN1463540A (zh) 登记用户偏好的方法及系统
JP2004516565A (ja) 選択の一貫性に基づいて推奨提案を生成する方法及び装置
CN1689001A (zh) 向用户或用户组呈现媒体内容的方法和系统
CN1659882A (zh) 基于个人资料档案的内容补充
WO2001015449A1 (en) Method and apparatus for creating recommendations from users profile built interactively
JPWO2013118198A1 (ja) お薦めコンテンツ提供装置、お薦めコンテンツ提供プログラムおよびお薦めコンテンツ提供方法
JP2004509577A (ja) 暗黙的及び明示的な視聴の選択を使用した推薦スコアを生成するための方法及び装置
CN1422497A (zh) 选择性更新用户简档的方法和装置
CN1624684A (zh) 信息处理器、信息处理方法和计算机程序
JP2005530255A (ja) 適応性ステレオタイプ・プロフィールを適用してユーザに関心アイテムを推奨するための方法及び装置
CN1879413A (zh) 节目推荐系统
KR20080021069A (ko) 콘텐츠에 대한 사용자 그룹의 전체 관심을 추정하기 위한방법 및 장치
JP2006344221A (ja) データベース内の少なくとも1つのデータユニットに1つまたは複数の重みを割り当てる方法および装置
Vildjiounaite et al. Unobtrusive dynamic modelling of tv programme preferences in a finnish household
Mukherjee et al. A context-aware recommendation system considering both user preferences and learned behavior
GB2438646A (en) System for content item recommendation
CN1770845A (zh) 与数据项目相关的数据的显示

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090701

Termination date: 20150827

EXPY Termination of patent right or utility model