Вопрос: Почему я должен использовать указатель, а не сам объект?


Я исхожу из фона Java и начал работать с объектами на C ++. Но одна вещь, которая пришла мне в голову, заключается в том, что люди часто используют указатели на объекты, а не сами объекты, например, это объявление:

Object *myObject = new Object;

скорее, чем:

Object myObject;

Или вместо использования функции, допустим, testFunc(), как это:

myObject.testFunc();

мы должны написать:

myObject->testFunc();

Но я не могу понять, почему мы должны это делать. Я бы предположил, что это связано с эффективностью и скоростью, поскольку мы получаем прямой доступ к адресу памяти. Я прав?


1319


источник


Ответы:


Очень жаль, что вы так часто видите динамическое распределение. Это просто показывает, сколько плохих программистов на C ++ существует.

В некотором смысле у вас есть два вопроса, связанных в один. Во-первых, когда мы должны использовать динамическое распределение (используя new)? Во-вторых, когда мы должны использовать указатели?

Важное сообщение о возврате домой - это то, что вы должны всегда используйте соответствующий инструмент для работы , Практически во всех ситуациях есть что-то более подходящее и безопасное, чем ручное динамическое распределение и / или использование необработанных указателей.

Динамическое распределение

В вашем вопросе вы продемонстрировали два способа создания объекта. Основное различие заключается в длительности хранения объекта. Когда вы делаете Object myObject;внутри блока объект создается с автоматическим временем хранения, что означает, что он будет автоматически уничтожен, когда он выходит за рамки. Когда вы это сделаете new Object(), объект имеет динамическую продолжительность хранения, что означает, что он остается в живых, пока вы явно не deleteЭто. При необходимости вы должны использовать только динамическую память. То есть, вам следует всегда предпочитайте создавать объекты с автоматическим хранением, когда можете ,

Основные две ситуации, в которых вам может потребоваться динамическое распределение:

  1. Вам нужен объект, чтобы пережить текущую область действия - этот конкретный объект в этом конкретном месте памяти, а не его копия. Если вы согласны с копированием / перемещением объекта (большую часть времени вы должны быть), вам следует выбрать автоматический объект.
  2. Вам нужно выделить много памяти , который может легко заполнить стек. Было бы неплохо, если бы нам не приходилось относиться к этому (большую часть времени вам не нужно), поскольку это действительно вне сферы компетенции C ++, но, к сожалению, нам приходится иметь дело с реальностью систем, которые мы для развивающихся.

Когда вам действительно требуется динамическое распределение, вы должны инкапсулировать его в интеллектуальный указатель или какой-либо другой тип, который выполняет RAII (например, стандартные контейнеры). Умные указатели предоставляют семантику владения динамически распределенных объектов. Взгляни на std::unique_ptrа также std::shared_ptr, например. Если вы используете их надлежащим образом, вы почти полностью можете не выполнять собственное управление памятью (см. Правило нуля ).

указатели

Тем не менее, существуют другие более общие применения для необработанных указателей за пределами динамического распределения, но у большинства есть альтернативы, которые вы должны предпочесть. Как прежде, всегда предпочитайте альтернативы, если вам действительно не нужны указатели ,

  1. Вам нужна эталонная семантика , Иногда вы хотите передать объект с помощью указателя (независимо от того, как он был выделен), потому что вы хотите, чтобы функция, к которой вы передаете его, имела доступ к этому конкретному объекту (а не к его копии). Однако в большинстве ситуаций вам следует выбирать типы ссылок для указателей, потому что это специально то, для чего они предназначены. Обратите внимание, что это не обязательно касается продления срока службы объекта за пределами текущего объема, как в ситуации 1 выше. Как и прежде, если вы согласны с передачей копии объекта, вам не нужна эталонная семантика.

  2. Вам нужен полиморфизм , Полиморфно (то есть в соответствии с динамическим типом объекта) вы можете вызывать функции только через указатель или ссылку на объект. Если это поведение вам нужно, вам нужно использовать указатели или ссылки. Опять же, ссылки должны быть предпочтительными.

  3. Вы хотите представить, что объект является необязательным разрешая nullptrдля передачи, когда объект опущен. Если это аргумент, вы должны предпочесть использовать аргументы по умолчанию или функции перегрузки. В противном случае вам следует использовать тип, который инкапсулирует это поведение, например std::optional(введенный на C ++ 17 - с более ранними стандартами C ++, используйте boost::optional).

  4. Вы хотите отделить единицы компиляции, чтобы улучшить время компиляции , Полезным свойством указателя является то, что вам требуется только объявление вперед для указанного типа (для фактического использования объекта вам потребуется определение). Это позволяет отделить части вашего процесса компиляции, что может значительно улучшить время компиляции. См. Идиома Pimpl ,

  5. Вы должны взаимодействовать с библиотекой C или библиотеки C-стиля. На данный момент вы вынуждены использовать необработанные указатели. Лучшее, что вы можете сделать, это убедиться, что вы позволите своим сырым указателям освободиться в последний момент. Вы можете получить необработанный указатель из умного указателя, например, используя его getчлен функция. Если библиотека выполняет какое-то выделение для вас, которое ожидает от вас освобождения с помощью дескриптора, вы можете часто обернуть дескриптор в интеллектуальном указателе с помощью настраиваемого делетера, который соответствующим образом освободит объект.


1329



Существует много вариантов использования указателей.

Полиморфное поведение , Для полиморфных типов указатели (или ссылки) используются для исключения нарезки:

class Base { ... };
class Derived : public Base { ... };

void fun(Base b) { ... }
void gun(Base* b) { ... }
void hun(Base& b) { ... }

Derived d;
fun(d);    // oops, all Derived parts silently "sliced" off
gun(&d);   // OK, a Derived object IS-A Base object
hun(d);    // also OK, reference also doesn't slice

Ссылочная семантика и избежание копирования , Для неполиморфных типов указатель (или ссылка) избегает копирования потенциально дорогого объекта

Base b;
fun(b);  // copies b, potentially expensive 
gun(&b); // takes a pointer to b, no copying
hun(b);  // regular syntax, behaves as a pointer

Обратите внимание, что C ++ 11 имеет семантику перемещения, которая позволяет избежать многих копий дорогостоящих объектов в аргумент функции и в качестве возвращаемых значений. Но использование указателя, безусловно, позволит избежать этого и позволит использовать несколько указателей на одном и том же объекте (тогда как объект может перемещаться только один раз).

Приобретение ресурсов , Создание указателя на ресурс с использованием newоператор является анти-модель в современном C ++. Используйте специальный класс ресурсов (один из стандартных контейнеров) или умный указатель ( std::unique_ptr<>или std::shared_ptr<>). Рассматривать:

{
    auto b = new Base;
    ...       // oops, if an exception is thrown, destructor not called!
    delete b;
}

против

{
    auto b = std::make_unique<Base>();
    ...       // OK, now exception safe
}

Необработанный указатель должен использоваться только как «вид» и никоим образом не связан с владением, будь то прямое создание или неявно через возвращаемые значения. Смотрите также это Q & A из C ++ FAQ ,

Более мелкозернистый контроль времени жизни Каждый раз, когда копируется общий указатель (например, как аргумент функции), ресурс, на который он указывает, остается в живых. Регулярные объекты (не созданные new, либо непосредственно вами, либо внутри класса ресурсов) уничтожаются при выходе из области видимости.


155



Есть много отличных ответов на этот вопрос, в том числе важные варианты использования форвардных деклараций, полиморфизм и т. Д., Но я чувствую, что часть «души» вашего вопроса не отвечает, а именно, что означают разные синтаксисы для Java и C ++.

Давайте рассмотрим ситуацию, сравнивающую два языка:

Ява:

Object object1 = new Object(); //A new object is allocated by Java
Object object2 = new Object(); //Another new object is allocated by Java

object1 = object2; 
//object1 now points to the object originally allocated for object2
//The object originally allocated for object1 is now "dead" - nothing points to it, so it
//will be reclaimed by the Garbage Collector.
//If either object1 or object2 is changed, the change will be reflected to the other

Ближайшим эквивалентом этого является:

C ++:

Object * object1 = new Object(); //A new object is allocated on the heap
Object * object2 = new Object(); //Another new object is allocated on the heap
delete object1;
//Since C++ does not have a garbage collector, if we don't do that, the next line would 
//cause a "memory leak", i.e. a piece of claimed memory that the app cannot use 
//and that we have no way to reclaim...

object1 = object2; //Same as Java, object1 points to object2.

Давайте посмотрим альтернативный способ C ++:

Object object1; //A new object is allocated on the STACK
Object object2; //Another new object is allocated on the STACK
object1 = object2;//!!!! This is different! The CONTENTS of object2 are COPIED onto object1,
//using the "copy assignment operator", the definition of operator =.
//But, the two objects are still different. Change one, the other remains unchanged.
//Also, the objects get automatically destroyed once the function returns...

Лучший способ подумать о том, что - более или менее - Java (неявно) обрабатывает указатели на объекты, а C ++ может обрабатывать либо указатели на объекты, либо сами объекты. Есть исключения из этого - например, если вы объявляете «примитивные» типы Java, это фактические значения, которые копируются, а не указатели. Так,

Ява:

int object1; //An integer is allocated on the stack.
int object2; //Another integer is allocated on the stack.
object1 = object2; //The value of object2 is copied to object1.

Тем не менее, использование указателей НЕ обязательно является правильным или неправильным способом обработки вещей; однако другие ответы покрывали это удовлетворительно. Общая идея заключается в том, что в C ++ у вас гораздо больше контроля над временем жизни объектов и от того, где они будут жить.

Возьмите домашнюю точку - Object * object = new Object()Конструкция на самом деле является тем, что ближе всего к семантике Java (или C #).


111



Еще одна веская причина использовать указатели для форвардные декларации , В достаточно большом проекте они могут ускорить время компиляции.


73



Предисловие

Java не похож на C ++, вопреки шуму. Машина hype для Java хотела бы, чтобы вы поверили, что, поскольку Java имеет синтаксис C ++, аналогичные языки. Ничто не может быть дальше от истины. Эта дезинформация является частью причины, по которой Java-программисты переходят на C ++ и используют синтаксис, подобный Java, без понимания последствий их кода.

Вперед мы идем

Но я не могу понять, почему мы должны это делать. Я бы предположил, что это   имеет отношение к эффективности и скорости, поскольку мы получаем прямой доступ к   адрес памяти. Я прав?

Напротив, на самом деле. Куча намного медленнее чем стек, потому что стек очень прост по сравнению с кучей. Автоматические переменные хранилища (ака стековые переменные) вызывают их деструкторы, когда они выходят за рамки. Например:

{
    std::string s;
}
// s is destroyed here

С другой стороны, если вы используете динамически распределенный указатель, его деструктор должен вызываться вручную. deleteназывает этот деструктор для вас.

{
    std::string* s = new std::string;
}
delete s; // destructor called

Это не имеет никакого отношения к newсинтаксис, распространенный в C # и Java. Они используются для совершенно разных целей.

Преимущества динамического распределения

1. Вам не нужно заранее знать размер массива

Одна из первых проблем, с которыми сталкиваются многие программисты на С ++, заключается в том, что, когда они принимают произвольный вход от пользователей, вы можете выделить фиксированный размер для переменной стека. Вы не можете изменить размер массивов. Например:

char buffer[100];
std::cin >> buffer;
// bad input = buffer overflow

Конечно, если вы использовали std::stringвместо, std::stringвнутренне изменяет размеры, так что это не должно быть проблемой. Но по существу решение этой проблемы - динамическое распределение. Вы можете выделить динамическую память на основе ввода пользователя, например:

int * pointer;
std::cout << "How many items do you need?";
std::cin >> n;
pointer = new int[n];

Примечание : Одна ошибка, которую делают многие новички, - это использование   массивы переменной длины. Это расширение GNU, а также одно в Clang   потому что они отражают многие расширения GCC. Итак, следующее int arr[n]не следует полагаться.

Поскольку куча намного больше, чем стек, можно произвольно распределить / перераспределить столько памяти, сколько ему нужно, тогда как у стека есть ограничение.

2. Массивы не являются указателями

Как вы это посоветовали? Ответ станет ясным, как только вы поймете путаницу / миф за массивами и указателями. Обычно считается, что они одинаковы, но это не так. Этот миф исходит из того факта, что указатели могут быть индексированы так же, как массивы, и потому что массивы распадаются на указатели на верхнем уровне в объявлении функции. Однако, как только массив распадается на указатель, указатель теряет sizeofИнформация. Так sizeof(pointer)даст размер указателя в байтах, который обычно составляет 8 байтов в 64-битной системе.

Вы не можете назначать массивы, только инициализировать их. Например:

int arr[5] = {1, 2, 3, 4, 5}; // initialization 
int arr[] = {1, 2, 3, 4, 5}; // The standard dictates that the size of the array
                             // be given by the amount of members in the initializer  
arr = { 1, 2, 3, 4, 5 }; // ERROR

С другой стороны, вы можете делать все, что хотите, с помощью указателей. К сожалению, поскольку различие между указателями и массивами размахивается руками на Java и C #, новички не понимают разницы.

3. Полиморфизм

Java и C # имеют средства, позволяющие рассматривать объекты как другие, например, используя asключевое слово. Поэтому, если кто-то хочет лечить Entityобъект как Playerобъект, можно было бы сделать Player player = Entity as Player;Это очень полезно, если вы намерены вызывать функции на однородном контейнере, которые должны применяться только к определенному типу. Функциональность может быть достигнута следующим образом:

std::vector<Base*> vector;
vector.push_back(&square);
vector.push_back(&triangle);
for (auto& e : vector)
{
     auto test = dynamic_cast<Triangle*>(e); // I only care about triangles
     if (!test) // not a triangle
        e.GenericFunction();
     else
        e.TriangleOnlyMagic();
}

Скажем, если бы только треугольники имели функцию Rotate, это была бы ошибка компилятора, если бы вы попытались вызвать ее на всех объектах класса. С помощью dynamic_cast, вы можете имитировать asключевое слово. Чтобы быть ясным, если сбой выполняется, он возвращает недопустимый указатель. Так !testявляется, по существу, сокращением для проверки того, testэто NULL или недопустимый указатель, что означает, что приведение не выполнено.

Преимущества автоматических переменных

Увидев все великие вещи, которые может сделать динамическое распределение, вы, вероятно, задаетесь вопросом, почему никто не будет использовать динамическое распределение все время? Я уже сказал вам одну причину: куча медленная. И если вам не нужна вся эта память, вы не должны злоупотреблять ею. Итак, вот некоторые недостатки в каком-то конкретном порядке:

  • Это склонность к ошибкам. Распределение памяти вручную опасно, и вы склонны к утечкам. Если вы не умеете использовать отладчик или valgrind(средство утечки памяти), вы можете вытащить волосы из головы. К счастью, идиомы RAII и умные указатели немного облегчают это, но вы должны быть знакомы с такими практиками, как «Правило из трех» и «Правило пяти». Вниманию много информации, и новички, которые либо не знают, либо не заботятся, попадают в эту ловушку.

  • Это не обязательно. В отличие от Java и C #, где идиоматично использовать newключевое слово везде, на C ++, вы должны использовать его только в случае необходимости. Обычная фраза идет, все выглядит как гвоздь, если у вас есть молоток. В то время как начинающие, которые начинают с C ++, боятся указателей и учатся использовать переменные стека по привычке, Java и C # Начало используя указатели, не понимая этого! Это буквально отступает на неправильную ногу. Вы должны отказаться от всего, что знаете, потому что синтаксис - это одно, а изучение языка - другое.

1. (N) RVO - Aka, (Именованный) Оптимизация возвращаемого значения

Одна оптимизация, которую делают многие компиляторы, - это вещи, называемые элизия а также оптимизация возвращаемого значения , Эти вещи могут избежать ненужных копий, которые полезны для очень больших объектов, таких как вектор, содержащий много элементов. Обычно обычной практикой является использование указателей для передать право собственности вместо копирования больших объектов на переехать их вокруг. Это привело к созданию перемещать семантику а также умные указатели ,

Если вы используете указатели, (N) RVO НЕ происходят. Более выгодно и менее подвержено ошибкам использовать (N) RVO, а не возвращать или пропускать указатели, если вас беспокоит оптимизация. Ошибка утечки может произойти, если вызывающая функция отвечает за deleteдинамически распределенного объекта и т. д. Трудно отследить право собственности на объект, если указатели передаются как горячий картофель. Просто используйте переменные стека, потому что это проще и лучше.


60



C ++ дает вам три способа передать объект: по указателю, по ссылке и по значению. Java ограничивает вас последним (единственное исключение - это примитивные типы, такие как int, boolean и т. Д.). Если вы хотите использовать C ++ не просто как странную игрушку, тогда вам лучше узнать разницу между этими тремя способами.

Java притворяется, что нет такой проблемы, как «кто и когда должен ее уничтожить?». Ответ: сборщик мусора, большой и ужасный. Тем не менее, он не может обеспечить 100% защиту от утечек памяти (да, Ява Можно утечка памяти ). На самом деле, GC дает вам ложное чувство безопасности. Чем больше ваш внедорожник, тем длиннее ваш путь к эвакуатору.

C ++ оставляет вас лицом к лицу с управлением жизненным циклом объекта. Ну, есть способы справиться с этим ( умные указатели семейство, QObject в Qt и т. д.), но ни один из них не может использоваться в режиме «огонь и забыть», как GC: вы должны всегда имейте в виду обработку памяти. Вы должны не только заботиться об уничтожении объекта, но и избегать уничтожения одного и того же объекта более одного раза.

Не испугались? Хорошо: циклические ссылки - обрабатывайте их самостоятельно, человек. И помните: убивайте каждый объект ровно один раз, мы C ++ runtimes не любят тех, кто возится с трупами, оставляют мертвых в одиночку.

Итак, вернемся к вашему вопросу.

Когда вы передаете свой объект по значению, а не по указателю или по ссылке, вы копируете объект (весь объект, будь то пара байтов или огромный дамп базы данных), вы достаточно умны, чтобы избежать последнего, вы?) каждый раз, когда вы делаете «=». И чтобы получить доступ к членам объекта, вы используете '.' (Точка).

Когда вы передаете свой объект по указателю, вы копируете только несколько байтов (4 в 32-битных системах, 8 на 64-битных), а именно - адрес этого объекта. И чтобы показать это всем, вы используете этот причудливый оператор «->» при доступе к членам. Или вы можете использовать комбинацию '*' и '.'.

Когда вы используете ссылки, вы получаете указатель, который претендует на значение. Это указатель, но вы получаете доступ к членам через «.».

И, чтобы взорвать свой ум еще раз: когда вы объявляете несколько переменных, разделенных запятыми, тогда (смотрите на руки):

  • Тип предоставляется всем
  • Модификатор значения / указателя / ссылки является индивидуальным

Пример:

struct MyStruct
{
    int* someIntPointer, someInt; //here comes the surprise
    MyStruct *somePointer;
    MyStruct &someReference;
};

MyStruct s1; //we allocated an object on stack, not in heap

s1.someInt = 1; //someInt is of type 'int', not 'int*' - value/pointer modifier is individual
s1.someIntPointer = &s1.someInt;
*s1.someIntPointer = 2; //now s1.someInt has value '2'
s1.somePointer = &s1;
s1.someReference = s1; //note there is no '&' operator: reference tries to look like value
s1.somePointer->someInt = 3; //now s1.someInt has value '3'
*(s1.somePointer).someInt = 3; //same as above line
*s1.somePointer->someIntPointer = 4; //now s1.someInt has value '4'

s1.someReference.someInt = 5; //now s1.someInt has value '5'
                              //although someReference is not value, it's members are accessed through '.'

MyStruct s2 = s1; //'NO WAY' the compiler will say. Go define your '=' operator and come back.

//OK, assume we have '=' defined in MyStruct

s2.someInt = 0; //s2.someInt == 0, but s1.someInt is still 5 - it's two completely different objects, not the references to the same one

21



В C ++ объекты, выделенные в стеке (используя Object object;оператор внутри блока) будет жить только в пределах области, в которой они объявлены. Когда блок кода завершает выполнение, объявленный объект уничтожается. Если вы выделяете память на кучу, используя Object* obj = new Object(), они продолжают жить в куче, пока не позвонишь delete obj,

Я хотел бы создать объект в куче, когда мне нравится использовать объект не только в блоке кода, который его объявил / выделил.


20



But I can't figure out why should we use it like this?

I will compare how it works inside function body, if you use:

Object myObject;

inside function, your myObject will get destroyed once this function returns. So this is usefull if you dont need your object outside your function. This object will be put on current thread stack.

If you write inside function body:

 Object *myObject = new Object;

then Object class instance pointed by myObject will not get destroyed once function ends, and allocation is on heap.

Now if you are java programmer, then the second example is closer to how object allocation works under java. This line: Object *myObject = new Object; is equivalent to java: Object myObject = new Object();. The difference is that under java myObject will get garbage collected, while under c++ it will not get freed, you must somewhere explicitly call `delete myObject;' otherwise you will introduce memory leaks.

Since c++11 you can use safe ways of dynamic allocations: new Object, by storing values in shared_ptr/unique_ptr.

std::shared_ptr<std::string> safe_str = make_shared<std::string>("make_shared");

// since c++14
std::unique_ptr<std::string> safe_str = make_unique<std::string>("make_shared"); 

also, objects are very often stored in containers, like map-s or vector-s, they will automatically manage lifetime of your objects.


18



Technically it is a memory allocation issue, however here are two more practical aspects of this. It has to do with two things: 1) Scope, when you define an object without a pointer you will no longer be able to access it after the code block it is defined in, whereas if you define a pointer with "new" then you can access it from anywhere you have a pointer to this memory until you call "delete" on the same pointer. 2) If you want to pass arguments to a function you want to pass a pointer or a reference in order to be more efficient. When you pass an Object then the object is copied, if this is an object that uses a lot of memory this might be CPU consuming (e.g. you copy a vector full of data). When you pass a pointer all you pass is one int (depending of implementation but most of them are one int).

Other than that you need to understand that "new" allocates memory on the heap that needs to be freed at some point. When you don't have to use "new" I suggest you use a regular object definition "on the stack".


11



Well the main question is Why should I use a pointer rather than the object itself? And my answer, you should (almost) never use pointer instead of object, because C++ has references, it is safer then pointers and guarantees the same performance as pointers.

Another thing you mentioned in your question:

Object *myObject = new Object;

How does it work? It creates pointer of Object type, allocates memory to fit one object and calls default constructor, sounds good, right? But actually it isn't so good, if you dynamically allocated memory (used keyword new), you also have to free memory manually, that means in code you should have:

delete myObject;

This calls destructor and frees memory, looks easy, however in big projects may be difficult to detect if one thread freed memory or not, but for that purpose you can try shared pointers, these slightly decreases performance, but it is much easier to work with them.


And now some introduction is over and go back to question.

You can use pointers instead of objects to get better performance while transferring data between function.

Take a look, you have std::string (it is also object) and it contains really much data, for example big XML, now you need to parse it, but for that you have function void foo(...) which can be declarated in different ways:

  1. void foo(std::string xml); In this case you will copy all data from your variable to function stack, it takes some time, so your performance will be low.
  2. void foo(std::string* xml); In this case you will pass pointer to object, same speed as passing size_t variable, however this declaration has error prone, because you can pass NULL pointer or invalid pointer. Pointers usually used in C because it doesn't have references.
  3. void foo(std::string& xml); Here you pass reference, basically it is the same as passing pointer, but compiler does some stuff and you cannot pass invalid reference (actually it is possible to create situation with invalid reference, but it is tricking compiler).
  4. void foo(const std::string* xml); Here is the same as second, just pointer value cannot be changed.
  5. void foo(const std::string& xml); Here is the same as third, but object value cannot be changed.

What more I want to mention, you can use these 5 ways to pass data no matter which allocation way you have chosen (with new or regular).


Another thing to mention, when you create object in regular way, you allocate memory in stack, but while you create it with new you allocate heap. It is much faster to allocate stack, but it is kind a small for really big arrays of data, so if you need big object you should use heap, because you may get stack overflow, but usually this issue is solved using STL containers and remember std::string is also container, some guys forgot it :)


6



Let's say that you have class A that contain class B When you want to call some function of class B outside class A you will simply obtain a pointer to this class and you can do whatever you want and it will also change context of class B in your class A

But be careful with dynamic object


5



There are many benefits of using pointers to object -

  1. Efficiency (as you already pointed out). Passing objects to functions mean creating new copies of object.
  2. Working with objects from third party libraries. If your object belongs to a third party code and the authors intend the usage of their objects through pointers only (no copy constructors etc) the only way you can pass around this object is using pointers. Passing by value may cause issues. (Deep copy / shallow copy issues).
  3. if the object owns a resource and you want that the ownership should not be sahred with other objects.

5