LCOV - code coverage report
Current view: top level - ogr/ogrsf_frmts/geojson - ogrjsoncollectionstreamingparser.cpp (source / functions) Hit Total Coverage
Test: gdal_filtered.info Lines: 192 209 91.9 %
Date: 2025-01-18 12:42:00 Functions: 15 16 93.8 %

          Line data    Source code
       1             : /******************************************************************************
       2             :  *
       3             :  * Project:  OpenGIS Simple Features Reference Implementation
       4             :  * Purpose:  Streaming parser for GeoJSON-like FeatureCollection
       5             :  * Author:   Even Rouault <even.rouault at spatialys.com>
       6             :  *
       7             :  ******************************************************************************
       8             :  * Copyright (c) 2017, Even Rouault <even.rouault at spatialys.com>
       9             :  *
      10             :  * SPDX-License-Identifier: MIT
      11             :  ****************************************************************************/
      12             : 
      13             : #include "ogrjsoncollectionstreamingparser.h"
      14             : 
      15             : #include "cpl_string.h"
      16             : #include "ogrlibjsonutils.h"  // CPL_json_object_object_get
      17             : 
      18             : #include "ogr_feature.h"
      19             : 
      20             : #define JSON_C_VER_013 (13 << 8)
      21             : 
      22             : #include <json.h>  // JSON-C
      23             : 
      24             : #if (!defined(JSON_C_VERSION_NUM)) || (JSON_C_VERSION_NUM < JSON_C_VER_013)
      25             : #include <json_object_private.h>  // just for sizeof(struct json_object)
      26             : #endif
      27             : 
      28             : #include <limits>
      29             : 
      30             : #if (!defined(JSON_C_VERSION_NUM)) || (JSON_C_VERSION_NUM < JSON_C_VER_013)
      31             : const size_t ESTIMATE_BASE_OBJECT_SIZE = sizeof(struct json_object);
      32             : #elif JSON_C_VERSION_NUM == JSON_C_VER_013  // no way to get the size
      33             : #if SIZEOF_VOIDP == 8
      34             : const size_t ESTIMATE_BASE_OBJECT_SIZE = 72;
      35             : #else
      36             : const size_t ESTIMATE_BASE_OBJECT_SIZE = 36;
      37             : #endif
      38             : #elif JSON_C_VERSION_NUM > JSON_C_VER_013  // we have json_c_object_sizeof()
      39             : const size_t ESTIMATE_BASE_OBJECT_SIZE = json_c_object_sizeof();
      40             : #endif
      41             : 
      42             : const size_t ESTIMATE_ARRAY_SIZE =
      43             :     ESTIMATE_BASE_OBJECT_SIZE + sizeof(struct array_list);
      44             : const size_t ESTIMATE_ARRAY_ELT_SIZE = sizeof(void *);
      45             : const size_t ESTIMATE_OBJECT_ELT_SIZE = sizeof(struct lh_entry);
      46             : const size_t ESTIMATE_OBJECT_SIZE =
      47             :     ESTIMATE_BASE_OBJECT_SIZE + sizeof(struct lh_table) +
      48             :     JSON_OBJECT_DEF_HASH_ENTRIES * ESTIMATE_OBJECT_ELT_SIZE;
      49             : 
      50             : /************************************************************************/
      51             : /*                     OGRJSONCollectionStreamingParser()                */
      52             : /************************************************************************/
      53             : 
      54         876 : OGRJSONCollectionStreamingParser::OGRJSONCollectionStreamingParser(
      55         876 :     bool bFirstPass, bool bStoreNativeData, size_t nMaxObjectSize)
      56             :     : m_bFirstPass(bFirstPass), m_bStoreNativeData(bStoreNativeData),
      57         876 :       m_nMaxObjectSize(nMaxObjectSize)
      58             : {
      59         876 : }
      60             : 
      61             : /************************************************************************/
      62             : /*                   ~OGRJSONCollectionStreamingParser()                */
      63             : /************************************************************************/
      64             : 
      65         876 : OGRJSONCollectionStreamingParser::~OGRJSONCollectionStreamingParser()
      66             : {
      67         876 :     if (m_poRootObj)
      68           3 :         json_object_put(m_poRootObj);
      69         876 :     if (m_poCurObj && m_poCurObj != m_poRootObj)
      70           3 :         json_object_put(m_poCurObj);
      71         876 : }
      72             : 
      73             : /************************************************************************/
      74             : /*                          StealRootObject()                           */
      75             : /************************************************************************/
      76             : 
      77         370 : json_object *OGRJSONCollectionStreamingParser::StealRootObject()
      78             : {
      79         370 :     json_object *poRet = m_poRootObj;
      80         370 :     if (m_poCurObj == m_poRootObj)
      81          25 :         m_poCurObj = nullptr;
      82         370 :     m_poRootObj = nullptr;
      83         370 :     return poRet;
      84             : }
      85             : 
      86             : /************************************************************************/
      87             : /*                            AppendObject()                            */
      88             : /************************************************************************/
      89             : 
      90      689738 : void OGRJSONCollectionStreamingParser::AppendObject(json_object *poNewObj)
      91             : {
      92      689738 :     if (m_bKeySet)
      93             :     {
      94       62561 :         CPLAssert(json_object_get_type(m_apoCurObj.back()) == json_type_object);
      95       62561 :         json_object_object_add(m_apoCurObj.back(), m_osCurKey.c_str(),
      96             :                                poNewObj);
      97       62561 :         m_osCurKey.clear();
      98       62561 :         m_bKeySet = false;
      99             :     }
     100             :     else
     101             :     {
     102      627177 :         CPLAssert(json_object_get_type(m_apoCurObj.back()) == json_type_array);
     103      627177 :         json_object_array_add(m_apoCurObj.back(), poNewObj);
     104             :     }
     105      689738 : }
     106             : 
     107             : /************************************************************************/
     108             : /*                            StartObject()                             */
     109             : /************************************************************************/
     110             : 
     111       20718 : void OGRJSONCollectionStreamingParser::StartObject()
     112             : {
     113       20718 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     114             :     {
     115           0 :         TooComplex();
     116           0 :         return;
     117             :     }
     118             : 
     119       20718 :     if (m_bInFeaturesArray && m_nDepth == 2)
     120             :     {
     121        6425 :         m_poCurObj = json_object_new_object();
     122        6425 :         m_apoCurObj.push_back(m_poCurObj);
     123        6425 :         if (m_bStoreNativeData)
     124             :         {
     125        1293 :             m_osJson = "{";
     126        1293 :             m_abFirstMember.push_back(true);
     127             :         }
     128        6425 :         m_bStartFeature = true;
     129             :     }
     130       14293 :     else if (m_poCurObj)
     131             :     {
     132       13393 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     133             :         {
     134        2547 :             m_osJson += "{";
     135        2547 :             m_abFirstMember.push_back(true);
     136             :         }
     137             : 
     138       13393 :         m_nCurObjMemEstimate += ESTIMATE_OBJECT_SIZE;
     139             : 
     140       13393 :         json_object *poNewObj = json_object_new_object();
     141       13393 :         AppendObject(poNewObj);
     142       13393 :         m_apoCurObj.push_back(poNewObj);
     143             :     }
     144         900 :     else if (m_bFirstPass && m_nDepth == 0)
     145             :     {
     146         373 :         m_poRootObj = json_object_new_object();
     147         373 :         m_apoCurObj.push_back(m_poRootObj);
     148         373 :         m_poCurObj = m_poRootObj;
     149             :     }
     150             : 
     151       20718 :     m_nDepth++;
     152             : }
     153             : 
     154             : /************************************************************************/
     155             : /*                             EndObject()                              */
     156             : /************************************************************************/
     157             : 
     158       20708 : void OGRJSONCollectionStreamingParser::EndObject()
     159             : {
     160       20708 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     161             :     {
     162           0 :         TooComplex();
     163           0 :         return;
     164             :     }
     165             : 
     166       20708 :     m_nDepth--;
     167             : 
     168       20708 :     if (m_bInFeaturesArray && m_nDepth == 2 && m_poCurObj)
     169             :     {
     170        6422 :         if (m_bStoreNativeData)
     171             :         {
     172        1293 :             m_abFirstMember.pop_back();
     173        1293 :             m_osJson += "}";
     174        1293 :             m_nTotalOGRFeatureMemEstimate +=
     175        1293 :                 m_osJson.size() + strlen("application/vnd.geo+json");
     176             :         }
     177             : 
     178             :         json_object *poObjTypeObj =
     179        6422 :             CPL_json_object_object_get(m_poCurObj, "type");
     180       12844 :         if (poObjTypeObj &&
     181        6422 :             json_object_get_type(poObjTypeObj) == json_type_string)
     182             :         {
     183        6422 :             const char *pszObjType = json_object_get_string(poObjTypeObj);
     184        6422 :             if (strcmp(pszObjType, "Feature") == 0)
     185             :             {
     186        6422 :                 GotFeature(m_poCurObj, m_bFirstPass, m_osJson);
     187             :             }
     188             :         }
     189             : 
     190        6422 :         json_object_put(m_poCurObj);
     191        6422 :         m_poCurObj = nullptr;
     192        6422 :         m_apoCurObj.clear();
     193        6422 :         m_nCurObjMemEstimate = 0;
     194        6422 :         m_bInCoordinates = false;
     195        6422 :         m_nTotalOGRFeatureMemEstimate += sizeof(OGRFeature);
     196        6422 :         m_osJson.clear();
     197        6422 :         m_abFirstMember.clear();
     198        6422 :         m_bEndFeature = true;
     199             :     }
     200       14286 :     else if (m_poCurObj)
     201             :     {
     202       13416 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     203             :         {
     204        2547 :             m_abFirstMember.pop_back();
     205        2547 :             m_osJson += "}";
     206             :         }
     207             : 
     208       13416 :         m_apoCurObj.pop_back();
     209             :     }
     210         870 :     else if (m_nDepth == 1)
     211             :     {
     212          66 :         m_bInFeatures = false;
     213             :     }
     214             : }
     215             : 
     216             : /************************************************************************/
     217             : /*                         StartObjectMember()                          */
     218             : /************************************************************************/
     219             : 
     220       64787 : void OGRJSONCollectionStreamingParser::StartObjectMember(const char *pszKey,
     221             :                                                          size_t nKeyLen)
     222             : {
     223       64787 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     224             :     {
     225           0 :         TooComplex();
     226           0 :         return;
     227             :     }
     228             : 
     229       64787 :     if (m_nDepth == 1)
     230             :     {
     231        2400 :         m_bInFeatures = strcmp(pszKey, "features") == 0;
     232        2400 :         m_bCanEasilyAppend = m_bInFeatures;
     233        2400 :         m_bInType = strcmp(pszKey, "type") == 0;
     234        2400 :         if (m_bInType || m_bInFeatures)
     235             :         {
     236        1538 :             m_poCurObj = nullptr;
     237        1538 :             m_apoCurObj.clear();
     238        1538 :             m_nRootObjMemEstimate = m_nCurObjMemEstimate;
     239             :         }
     240         862 :         else if (m_poRootObj)
     241             :         {
     242         378 :             m_poCurObj = m_poRootObj;
     243         378 :             m_apoCurObj.clear();
     244         378 :             m_apoCurObj.push_back(m_poCurObj);
     245         378 :             m_nCurObjMemEstimate = m_nRootObjMemEstimate;
     246             :         }
     247             :     }
     248       62387 :     else if (m_nDepth == 3 && m_bInFeaturesArray)
     249             :     {
     250       45202 :         m_bInCoordinates = strcmp(pszKey, "coordinates") == 0 ||
     251       22601 :                            strcmp(pszKey, "geometries") == 0;
     252             :     }
     253             : 
     254       64787 :     if (m_poCurObj)
     255             :     {
     256       62561 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     257             :         {
     258        8197 :             if (!m_abFirstMember.back())
     259        4654 :                 m_osJson += ",";
     260        8197 :             m_abFirstMember.back() = false;
     261             :             m_osJson +=
     262        8197 :                 CPLJSonStreamingParser::GetSerializedString(pszKey) + ":";
     263             :         }
     264             : 
     265       62561 :         m_nCurObjMemEstimate += ESTIMATE_OBJECT_ELT_SIZE;
     266       62561 :         m_osCurKey.assign(pszKey, nKeyLen);
     267       62561 :         m_bKeySet = true;
     268             :     }
     269             : }
     270             : 
     271             : /************************************************************************/
     272             : /*                             StartArray()                             */
     273             : /************************************************************************/
     274             : 
     275      221431 : void OGRJSONCollectionStreamingParser::StartArray()
     276             : {
     277      221431 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     278             :     {
     279           0 :         TooComplex();
     280           0 :         return;
     281             :     }
     282             : 
     283      221431 :     if (m_nDepth == 1 && m_bInFeatures)
     284             :     {
     285         769 :         m_bInFeaturesArray = true;
     286             :     }
     287      220662 :     else if (m_poCurObj)
     288             :     {
     289      220563 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     290             :         {
     291       16452 :             m_osJson += "[";
     292       16452 :             m_abFirstMember.push_back(true);
     293             :         }
     294             : 
     295      220563 :         m_nCurObjMemEstimate += ESTIMATE_ARRAY_SIZE;
     296             : 
     297      220563 :         json_object *poNewObj = json_object_new_array();
     298      220563 :         AppendObject(poNewObj);
     299      220563 :         m_apoCurObj.push_back(poNewObj);
     300             :     }
     301      221431 :     m_nDepth++;
     302             : }
     303             : 
     304             : /************************************************************************/
     305             : /*                          StartArrayMember()                          */
     306             : /************************************************************************/
     307             : 
     308      633713 : void OGRJSONCollectionStreamingParser::StartArrayMember()
     309             : {
     310      633713 :     if (m_poCurObj)
     311             :     {
     312      627180 :         m_nCurObjMemEstimate += ESTIMATE_ARRAY_ELT_SIZE;
     313             : 
     314      627180 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     315             :         {
     316       43163 :             if (!m_abFirstMember.back())
     317       26713 :                 m_osJson += ",";
     318       43163 :             m_abFirstMember.back() = false;
     319             :         }
     320             :     }
     321      633713 : }
     322             : 
     323             : /************************************************************************/
     324             : /*                               EndArray()                             */
     325             : /************************************************************************/
     326             : 
     327      221419 : void OGRJSONCollectionStreamingParser::EndArray()
     328             : {
     329      221419 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     330             :     {
     331           0 :         TooComplex();
     332           0 :         return;
     333             :     }
     334             : 
     335      221419 :     m_nDepth--;
     336      221419 :     if (m_nDepth == 1 && m_bInFeaturesArray)
     337             :     {
     338         765 :         m_bInFeaturesArray = false;
     339             :     }
     340      220654 :     else if (m_poCurObj)
     341             :     {
     342      220555 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     343             :         {
     344       16452 :             m_abFirstMember.pop_back();
     345       16452 :             m_osJson += "]";
     346             :         }
     347             : 
     348      220555 :         m_apoCurObj.pop_back();
     349             :     }
     350             : }
     351             : 
     352             : /************************************************************************/
     353             : /*                              String()                                */
     354             : /************************************************************************/
     355             : 
     356       23333 : void OGRJSONCollectionStreamingParser::String(const char *pszValue, size_t nLen)
     357             : {
     358       23333 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     359             :     {
     360           0 :         TooComplex();
     361           0 :         return;
     362             :     }
     363             : 
     364       23333 :     if (m_nDepth == 1 && m_bInType)
     365             :     {
     366         769 :         m_bIsTypeKnown = true;
     367         769 :         m_bIsFeatureCollection = strcmp(pszValue, "FeatureCollection") == 0;
     368             :     }
     369       22564 :     else if (m_poCurObj)
     370             :     {
     371       22025 :         if (m_bFirstPass)
     372             :         {
     373       15627 :             if (m_bInFeaturesArray)
     374       15195 :                 m_nTotalOGRFeatureMemEstimate += sizeof(OGRField) + nLen;
     375             : 
     376       15627 :             m_nCurObjMemEstimate += ESTIMATE_BASE_OBJECT_SIZE;
     377       15627 :             m_nCurObjMemEstimate += nLen + sizeof(void *);
     378             :         }
     379       22025 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     380             :         {
     381        2969 :             m_osJson += CPLJSonStreamingParser::GetSerializedString(pszValue);
     382             :         }
     383       22025 :         AppendObject(json_object_new_string(pszValue));
     384             :     }
     385             : }
     386             : 
     387             : /************************************************************************/
     388             : /*                              Number()                                */
     389             : /************************************************************************/
     390             : 
     391      432287 : void OGRJSONCollectionStreamingParser::Number(const char *pszValue, size_t nLen)
     392             : {
     393      432287 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     394             :     {
     395           1 :         TooComplex();
     396           1 :         return;
     397             :     }
     398             : 
     399      432286 :     if (m_poCurObj)
     400             :     {
     401      432272 :         if (m_bFirstPass)
     402             :         {
     403      226426 :             if (m_bInFeaturesArray)
     404             :             {
     405      226366 :                 if (m_bInCoordinates)
     406           0 :                     m_nTotalOGRFeatureMemEstimate += sizeof(double);
     407             :                 else
     408      226366 :                     m_nTotalOGRFeatureMemEstimate += sizeof(OGRField);
     409             :             }
     410             : 
     411      226426 :             m_nCurObjMemEstimate += ESTIMATE_BASE_OBJECT_SIZE;
     412             :         }
     413      432272 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     414             :         {
     415       29349 :             m_osJson.append(pszValue, nLen);
     416             :         }
     417             : 
     418      432272 :         if (CPLGetValueType(pszValue) == CPL_VALUE_REAL)
     419             :         {
     420      372195 :             AppendObject(json_object_new_double(CPLAtof(pszValue)));
     421             :         }
     422       60077 :         else if (nLen == strlen("Infinity") && EQUAL(pszValue, "Infinity"))
     423             :         {
     424           2 :             AppendObject(json_object_new_double(
     425             :                 std::numeric_limits<double>::infinity()));
     426             :         }
     427       60075 :         else if (nLen == strlen("-Infinity") && EQUAL(pszValue, "-Infinity"))
     428             :         {
     429           2 :             AppendObject(json_object_new_double(
     430           2 :                 -std::numeric_limits<double>::infinity()));
     431             :         }
     432       60073 :         else if (nLen == strlen("NaN") && EQUAL(pszValue, "NaN"))
     433             :         {
     434           2 :             AppendObject(json_object_new_double(
     435             :                 std::numeric_limits<double>::quiet_NaN()));
     436             :         }
     437             :         else
     438             :         {
     439       60071 :             AppendObject(json_object_new_int64(CPLAtoGIntBig(pszValue)));
     440             :         }
     441             :     }
     442             : }
     443             : 
     444             : /************************************************************************/
     445             : /*                              Boolean()                               */
     446             : /************************************************************************/
     447             : 
     448         150 : void OGRJSONCollectionStreamingParser::Boolean(bool bVal)
     449             : {
     450         150 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     451             :     {
     452           0 :         TooComplex();
     453           0 :         return;
     454             :     }
     455             : 
     456         150 :     if (m_poCurObj)
     457             :     {
     458         138 :         if (m_bFirstPass)
     459             :         {
     460          76 :             if (m_bInFeaturesArray)
     461          62 :                 m_nTotalOGRFeatureMemEstimate += sizeof(OGRField);
     462             : 
     463          76 :             m_nCurObjMemEstimate += ESTIMATE_BASE_OBJECT_SIZE;
     464             :         }
     465         138 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     466             :         {
     467           4 :             m_osJson += bVal ? "true" : "false";
     468             :         }
     469             : 
     470         138 :         AppendObject(json_object_new_boolean(bVal));
     471             :     }
     472             : }
     473             : 
     474             : /************************************************************************/
     475             : /*                               Null()                                 */
     476             : /************************************************************************/
     477             : 
     478        1349 : void OGRJSONCollectionStreamingParser::Null()
     479             : {
     480        1349 :     if (m_nMaxObjectSize > 0 && m_nCurObjMemEstimate > m_nMaxObjectSize)
     481             :     {
     482           0 :         TooComplex();
     483           0 :         return;
     484             :     }
     485             : 
     486        1349 :     if (m_poCurObj)
     487             :     {
     488        1347 :         if (m_bInFeaturesArray && m_bStoreNativeData && m_nDepth >= 3)
     489             :         {
     490          39 :             m_osJson += "null";
     491             :         }
     492             : 
     493        1347 :         m_nCurObjMemEstimate += ESTIMATE_BASE_OBJECT_SIZE;
     494        1347 :         AppendObject(nullptr);
     495             :     }
     496             : }
     497             : 
     498             : /************************************************************************/
     499             : /*                             Exception()                              */
     500             : /************************************************************************/
     501             : 
     502           2 : void OGRJSONCollectionStreamingParser::Exception(const char *pszMessage)
     503             : {
     504           2 :     CPLError(CE_Failure, CPLE_AppDefined, "%s", pszMessage);
     505           2 : }

Generated by: LCOV version 1.14