citibike-tripdata
perl
{
"end_station_id": "6756.05",
"member_casual": "member",
"@timestamp": "2022-12-11T05:36:16.645Z",
"end_lat": "40.762009",
"start_station_name": "W 21 St & 6 Ave",
"start_lat": "40.74173969",
"ended_at": "2022-01-22 14:53:18",
"start_station_id": "6140.05",
"start_lng": "-73.99415556",
"rideable_type": "classic_bike",
"started_at": "2022-01-22 14:28:32",
"tags": [
"citibike",
"tripdata"
],
"ride_id": "D1FCEF55EB4A807F",
"end_station_name": "W 44 St & 11 Ave",
"end_lng": "-73.996975"
}
常用属性
index
· 是否创建索引信息
· 是否应用与检索查询
index = false





store
· ES会存储原始值在_source里面,除此之外lucene中也可以存储。
· stored_fields,查询时输入存储的字段名称。
store = true




enabled
· object对象型字段专用,可以有效避免对象下的字段是否创建索引,默认启用。
· 默认true,当设置为false的时候,只会存储原始数据,不创建索引,不能被检索。
enabled = false



subobjects
· 子对象是否启用严格验证,默认true。
· 子对象字段命名若采用非标准json结构,可能会产生冲突,可以关闭验证 subobjects=false



doc_value
· 是否启用列式存储,默认启用,用于数据聚合、排序、检索查询
· doc_value,属性关键词,默认true


由于该字段设置了
"index": false
,Elasticsearch无法对其建立索引,因此聚合操作会失败


doc_values=true



null_value

null_value=xyz




properties




dynamic




ignore_above
· 截取选项,超过设定长度,字符串会截取。
· 特别注意,超过长度之后,该字段将不会创建索引,不能用于检索,也即是等同index=false,经常出现这种问题错误



fields










coerce
ES是一种宽松式设计,数值字段默认情况下,必须符合格式要求,有时候也可以容许一定的格式,便于高效开发。



ignore_malformed
· 设定字段类型,若输入的数据与类型不匹配,默认是会报错,且不容许数据插入。
· 若设定忽略,则数据可以插入到索引。


format日期格式化
· 日期格式化,ES日期非常宽泛与自由
· 默认可以输入多种格式,与传统MySQL数据库不一样,通过此属性可以限制格式,保证内容一致。




copy_to
· 文本字段内容复制,用于创建字段的索引信息




alias




高级属性 - fielddata




高级属性 - eager_global_ordinals






