提高MongoDB效率九大优化方式

MongoDB九大优化方式:

第一:单次批量查询比循环逐条查询更快;

循环查询是开发者最常犯的错误写法。循环嵌套查询写代码快,逻辑简单,最耗时。在小批量数据处理时间一般远小于数据库查询时间。所以尽量避免增加查询次数,能把多次查询合并成单次批量查询尽量查询。解决办法:先预处理把查询字段合并成一个数组,然后数组中的同类项,接着用批量查询(包括管道操作),转成map,最后用map的get方法查找数据。

javascript 复制代码
let list = await VRRecord.find({
            type: '航拍',
            status: {
                $in: ['', null, 'FINISH']
            }
        }, '-_id -estate_id -views_num').sort({
            create_time: -1
        }).lean().exec();
        // let time1 =  new Date().getTime();
        // logger.debug('time1-time0:', time1-time0, 'list.length:', list.length);
        // 使用map和concat来遍历list,并提取每个元素的estates数组
        let newList = [].concat(...list.map(item => {
            // 确保estates是一个数组
            return Array.isArray(item.estates) ? item.estates : [];
        }));
        // 使用Set来去除重复的
        newList = Array.from(new Set(newList));
        // logger.debug('newList:', newList);
        let subUserMap = new Map();
        if(newList.length > 0){
            let realEstateList = await EstateModel.find({
                id: {
                    $in: newList
                }
            },'-_id id real_estate_name').lean().exec();
            subUserMap = new Map(realEstateList.map(item => [item.id, item]));
        }
        // logger.debug('subUserMap:', subUserMap);
        let newList2 = [].concat(...list.map(item => {
            // 确保lands是一个数组
            return Array.isArray(item.lands) ? item.lands : [];
        }));
        // 使用Set来去除重复的
        newList2 = Array.from(new Set(newList2));
        // logger.debug('newList:', newList);
        let subUserMap2 = new Map();
        if(newList2.length > 0){
            let matchLands = await LandModel.find({
                id: {
                    $in: newList2
                }
            },'-_id id name').lean().exec();
            subUserMap2 = new Map(matchLands.map(item => [item.id, item]));
        }

        let nameMap = {};
        for (let i=0; i<list.length; i++) {
            list[i].hasMarker = false;
            if (list[i].markers) {
                for (let key in list[i].markers) {
                    if (list[i].markers[key].length) {
                        list[i].hasMarker = true;
                        break;
                    }
                }
            }
            delete list[i].markers;
            let matchEstates = [];
            if (list[i].estates) {
                for (let k=0; k<list[i].estates.length; k++) {
                    let id = list[i].estates[k];
                    if (!nameMap[id]) {
                        let realEstate = subUserMap.get(id);
                        // await EstateModel.findOne({
                        //     id: id
                        // },'-_id id real_estate_name').lean().exec();
                        nameMap[id] = realEstate;
                    }
                    if (nameMap[id]) {
                        matchEstates.push(nameMap[id]);
                    }
                }
            }
            list[i].real_estate_name = matchEstates.map(x => x.real_estate_name).join(',');
            list[i].matchEstates = matchEstates;

            if (list[i].lands) {
                let newLands = [];
                list[i].lands.forEach(land =>{
                    if(land){
                        let item = subUserMap2.get(land);
                        if(item){
                            newLands.push(item);
                        }
                    }
                });
                // let matchLands = await LandModel.find({
                //     id: {$in: list[i].lands}
                // }, 'id name -_id');
                list[i].matchLands = newLands;//matchLands;
            }

        }

这种修改可以把原来嵌套查询达到12秒的处理时间降低到0.3秒

第二:尽量避免嵌入不断增加的数据;

MongoDB存储数据的机制决定了对数组不断追加数据是很低效的。在正常使用中数组和对象大小应该相对固定。

第三:预填充数据;

比如统计每个小时的访问量,先建一个24个0的数组。

第四:尽可能预先分配空间;

知道文档开始比较小,后面会变为确定的大小的,可以先存个确定大小的填充字段,再删除( u n s e t ) 这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。第五:文档要自给自足; M o n g o D B 只存取数据,不做计算。计算尽量在客户端(包括调用 M o n g o D B 的后台服务器)完成。第六:避免使用 unset)这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。 第五:文档要自给自足; MongoDB只存取数据,不做计算。计算尽量在客户端(包括调用MongoDB的后台服务器)完成。 第六:避免使用 unset)这个字段。如果存储文档时便为其分配将来所需的空间,之后便不再需要移动它。第五:文档要自给自足;MongoDB只存取数据,不做计算。计算尽量在客户端(包括调用MongoDB的后台服务器)完成。第六:避免使用where;

第七:编写代码处理数据完整性问题;

在后台执行一些检查和保护数据的脚本,能解除很多后顾之忧,避免出现脏数据。

第八:使用正确的类型;

数据类型影响数据的查询方式、数据存放顺序、占用多少空间。数字,日期,字符串。

第九:用简单唯一的id替换掉_id。

节省空间,注意这个唯一id要是唯一的。原来_id具有递增不重复的作用,代替它的id也有具有该功能来避免出现脏数据。

相关推荐
桀桀桀桀桀桀11 分钟前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥1 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452001 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina2 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina2 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j
尘浮生2 小时前
Java项目实战II基于Spring Boot的光影视频平台(开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·maven·intellij-idea
威哥爱编程2 小时前
SQL Server 数据太多如何优化
数据库·sql·sqlserver
小华同学ai2 小时前
AJ-Report:一款开源且非常强大的数据可视化大屏和报表工具
数据库·信息可视化·开源
Acrelhuang3 小时前
安科瑞5G基站直流叠光监控系统-安科瑞黄安南
大数据·数据库·数据仓库·物联网
十叶知秋3 小时前
【jmeter】jmeter的线程组功能的详细介绍
数据库·jmeter·性能测试